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Abréviations 


Signaux : 

EGG : signal électroglottographique 

Paramètres glottiques ou acoustiques : 

VLP (Vertical larynx Position) : position verticale du larynx 
Oq: quotient ouvert 

/o : fréquence fondamentale / fréquence vibratoire glottique 
SPL (Sound Pressure Level) : niveau de pression acoustique 

Paramètres spectraux : 

FB (Frequency Band) : bande fréquentielle 
ER (Energy Ratio) : rapport d’énergie 
Fi: fréquence du i ieme formant 

Voyelles : 

j\j : comme dans ami 
/o/ : comme dans gauche 
/o/ : comme dans pomme 
/a/ : comme dans nappe 

/p/ : comme dans deux 
/œ/ : comme dans meuble 
/u/ : comme dans doux 
/y/ : comme dans mûre 
/e/ : comme dans lait 
/e/ : comme dans blé 

Notes de musique : 




sol2 si2 


TT 


O 


do3 ré3mi3 la3 do4 




Conventions statistiques : 


p<0.001 : 

*** 

(très significatif) 

0.001<p<0.01 : 

** 

(significatif) 

0.01<p<0.1: 

* 

(peu significatif) 

p>0.1 : 

ns 

(non significatif) 













Liste des exemples sonores 


Plusieurs exemples sonores ont été utilisés pour illuster ce travail. Ces sons sont disponibles, 
sur demande, à l’équipe Lutheries, Acoustique et Musique (LAM) de l’Institut Jean le Rond 
d’Alembert; 11, rue de Lourmel, 75015 PARIS, ou via le site internet www.lam.jussieu.fr. 

[1] Glissando ascendant effectué par une femme, couvrant les quatre mécanismes vibratoires 
laryngés. 

[2] Glissando ascendant et descendant effectué par un ténor (T4). Voyelle: /i/. 

[3] Son tenu (/O = 118 Hz) effectué par un ténor (T3), avec plusieurs changements de voyelles. 

[4] Decrescendo effectué par une soprano (S3), sur sol#3 et sur la voyelle /o/, en mécanisme 
M2. 

[5] Son tenu chanté par un contre-ténor (CTI), sur do3 et en mécanisme M2, avec changement 
de voyelle (début sur /a/, fin sur /i/). 

[6] Autre exemple de son tenu chanté par un contre-ténor (CTI), sur do3 et en mécanisme M2, 
avec changement de voyelle (début sur /a/, fin sur /i/). 

[7] Decrescendo effectué par un ténor (Tl) sur ré3 et sur la voyelle /a/, en mécanisme Ml. 

[8] Decrescendo effectué par une soprano (S3) sur sib3 et sur la voyelle /a/, en mécanisme M2. 

[9] Decrescendo effectué par une mezzo-soprano (MS3) sur mi3 et sur la voyelle /i/, en mécanisme 
M2. 

[10] Decrescendo effectué par une mezzo-soprano (MS4) sur mi3 et sur la voyelle /a/, en méca¬ 
nisme Ml. 

[11] Decrescendo effectué par une mezzo-soprano (MS4) sur mi3 et sur la voyelle /a/, en méca¬ 
nisme M2. 

[12] Exemple de yodel suisse. 

[13] Exemple d’utilisation du tahrir. 

[14] Exemple de tahrir effectué sur mib3, et sur la voyelle /a/. 

[15] Exemple de tahrir effectué sur mib3, et sur la voyelle /i/. 

[16] Son tenu marqué par plusieurs alternances de mécanismes laryngés (Ml et M2) effectué par 
un baryton-basse (B3), sur fa#3 et sur voyelle /a/. 

[17] Son tenu marqué par l’alternance des mécanismes laryngés Ml et M2, mais pour lesquels 
les sauts de fréquence sont très petits. Production effectuée par une mezzo-soprano (MS2) sur 
fa#3 et sur la voyelle /a/. 

[18] Crescendo effectué par un contre-ténor (CTI) sur un do2, et sur la voyelle /a/, en mécanisme 
Ml. 
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Introduction 


Le chant est une activité partagée par tous les humains, dans toutes les cultures et depuis 
la nuit des temps. Le relatif isolement de différentes cultures traditionnelles a favorisé le déve¬ 
loppement de pratiques vocales extrêmement diverses, que le monde occidental découvre depuis 
plusieurs décennies (voir les enregistrements effectuées lors de l’exposition universelle de 1900, 
ou pour une publication récente, les CDs «les voix du monde», Zemp et al ., 1996), parfois avec 
stupéfaction. 

Au niveau physiologique et acoustique, toutes ces pratiques vocales sont pourtant produites 
par un instrument de musique, l’appareil vocal, et mettent en jeu le même processus physique: 
de par l’expiration, une vibration acoustique est générée quelque part dans l’appareil vocal (dans 
la plupart des cas, au niveau du larynx), se propage dans le conduit vocal et rayonne dans le 
milieu extérieur. La plupart des traditions musicales utilisant les sons voisés (produit par la 
vibration des cordes vocales) doit donc jouer simultanément sur la vibration laryngée et sur la 
propagation de l’onde sonore dans le conduit vocal. 

En termes de vibration laryngée, le chant lyrique occidental occupe une place particulière 
dans la mesure où il nécessite la production d’une très large étendue de fréquence : certaines 
basses peuvent descendre au dol (66 Hz) (comme pour le rôle de Zarastro, dans l’opéra «La 
flûte enchantée» de Mozart), et des soprani peuvent monter au sol5 (1568 Hz) (comme dans l’air 
de concert «Popoli di Tessaglia», de Mozart aussi). Couvrir une bande de fréquence aussi large 
avec un si petit instrument (les cordes vocales ont une longueur de l’ordre de 1.5 cm) nécessite 
l’utilisation de différentes configurations vibratoires, que nous appellerons mécanismes laryngés 
au cours de cette thèse 1 . Dans le même temps, les chanteurs vocalisent ou articulent un texte. 
Quelle est la nature de la relation entre la vibration laryngée et la production des voyelles? 
Comment les chanteurs la gèrent-ils? Accomplissent-ils des ajustements différents en fonction 
du mécanisme laryngé utilisé? 

De nombreuses études ont porté sur le fonctionnement physiologique et acoustique de l’ap¬ 
pareil phonatoire (Fant, 1970; Titze, 1994; Sundberg, 1987). Nous disposons aujourd’hui d’une 
connaissance assez précise du fonctionnement laryngé d’une part (Hirano et al ., 1969; Fant, 
1970; Roubeau, 1993; Henrich, 2001), ainsi que de l’acoustique du conduit vocal d’autre part 
(Flanagan, 1965; Story, 1995). Pour modéliser le système dans son ensemble, les chercheurs 
ont modélisé ces deux niveaux de productions de manière indépendante (Fant, 1970; Flanagan, 
1965). La raison essentielle est probablement que les études ont été orientées sur la production de 
la parole, pour laquelle l’hypothèse d’indépendance de ces deux niveaux de production a permis 
d’obtenir des résultats satisfaisants. 

En ce qui concerne la pratique du chant, l’hypothèse d’indépendance de la source et du filtre 
n’est probablement pas valide, que cette indépendance soit située au niveau du fonctionnement 
de l’appareil vocal ou de la façon dont le chanteur l’utilise. En particulier, il est connu que les 
chanteurs (lyriques comme traditionnels) adaptent la voyelle en fonction de la hauteur (Sund¬ 
berg, 1975; Joliveau et al ., 2004a; Henrich et al ., 2007), phénomène qui est connu des physiciens 
comme des musiciens (nous développerons ce point dans les chapitres 1 et 2). Les chanteurs ne 
«gèrent» donc pas la source et le filtre indépendamment l’un de l’autre. A priori, ces ajustements 
peuvent être dus au fonctionnement de l’appareil vocal, ou être effectués volontairement par le 
chanteur. Existe-t-il des ajustements effectués avec une configuration laryngée et pas une autre 


1. Le terme de mécanisme laryngé sera défini précisément dans le chapitre 1.2 
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(indépendamment de la hauteur du son) ? Sont-ils recherchés ou évités par les musiciens? 

Pour tenter de répondre à ces questions, nous avons étudié, dans les deux principaux mé¬ 
canismes laryngés, l’influence de la voyelle sur des paramètres de la production vocale qui sont 
essentiels pour les physiciens comme pour les chanteurs : nous avons étudié la dynamique vo¬ 
cale et la répartition de l’énergie dans le spectre. Ces deux aspects de la voix nous permettent 
d’approcher acoustiquement la notion perceptive (et musicale) d’intensité vocale et de timbre. 
Nous allons décrire leurs variations en fonction de la hauteur. Nous allons également étudier 
l’utilisation des voyelles pour gérer les transitions d’une configuration vibratoire à l’autre. 

Présentation générale de l’étude 
La problématique 

Dans une première partie, nous allons présenter le fonctionnement vocal et la façon dont il est 
décrit par la science acoustique. Nous verrons qu’il met en jeu le niveau glottique et le niveau 
résonantiel. Nous présenterons les relations entre ces deux niveaux de production vocale, dans 
la parole et dans le chant, et nous verrons comment elles intègrent les configurations vibratoires 
laryngées que nous étudions à travers les mécanismes. 

Nous présenterons également nos investigations visant à expliciter l’expertise qu’ont les chan¬ 
teurs par rapport aux mécanismes et aux voyelles. Nous avons en particulier étudié plusieurs 
traités de chant, interviewé un chanteur et effectué une enquête écrite an près de 16 chanteurs. 

Mécanismes laryngés, voyelles et phonétogrammes 

Dans une deuxième partie, nous allons étudier l’influence de la voyelle sur la dynamique vocale 
dans les deux mécanismes vibratoires laryngés principaux. Cette étude est effectuée à travers le 
phonétogramme, établi séparément dans les deux mécanismes laryngés. Pour cela, une vaste base 
de données a été mise en place au cours de ce travail avec le concours de 21 chanteurs. Elle permet 
l’étude de la dynamique vocale, de paramètres acoustiques et glottiques en fonction de la hauteur, 
de l’intensité, de la voyelle et du mécanisme laryngé. Ces enregistrements permettent également 
de valider la voyelle utilisée par mesures formantiques. La comparaison des phonétogrammes 
dans les deux mécanismes laryngés permettra d’établir dans quelle mesure l’influence de la 
voyelle sur la dynamique vocale est la même. 

Nous décrirons ensuite l’évolution du quotient ouvert, de la position verticale du larynx et 
de l’amplitude du signal électroglottographique (indice de la surface de contact maximale des 
cordes vocales au cours du cycle glottique) au sein du phonétogramme, l’objectif étant d’établir 
comment ces paramètres sont influencés par la voyelle. Le quotient ouvert est un paramètre de 
source dont l’influence dans la forme de l’onde de débit glottique a été modélisée, ce qui nous 
permettra d’évaluer son rôle dans l’influence de la voyelle sur les limites phonétographiques. Les 
deux autres paramètres glottiques seront d’abord étudiés en fonction de la hauteur, de l’intensité, 
du mécanisme laryngé, pour prendre enfin en compte l’influence de la voyelle. 

Mécanismes laryngés, voyelles et spectres 

Dans la troisième partie, nous verrons si la voyelle influence dans de mêmes proportions la 
répartition de l’énergie dans le spectre dans les deux mécanismes laryngés. Pour cela, nous avons 
défini trois bandes fréquentielles. La première va de 0 à 2 kHz pour les hommes et de 0 à 2.4 kHz 
pour les femmes, et correspond aux basses fréquences. La deuxième va de 2 à 4.5 kHz pour les 
hommes, de 2.4 kHz à 5.4 kHz pour les femmes, et englobe le formant du chanteur, renforcement 
spectral particulièrement développé par les chanteurs lyriques, et la troisième, de 4.5 à 10 kHz 
pour les hommes et de 5.4 kHz à 12 kHz pour les femmes, correspond aux hautes fréquences. 

L’énergie dans la deuxième bande sera plus particulièrement étudiée en fonction de la tes¬ 
siture des chanteurs, de leur utilisation des différents mécanismes laryngés. Nous verrons com¬ 
ment l’énergie du formant du chanteur varie avec l’intensité, dans quelle mesure elle dépend de 
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la voyelle et du mécanisme laryngé. Enfin, nous étudierons l’énergie dans la troisième bande 
fréquentielle, et nous verrons si elle dépend du mécanisme laryngé, et de la voyelle. 

Mécanismes laryngés, voyelles et transitions de mécanismes 

Dans la quatrième partie, nous traiterons de l’influence de la voyelle sur les sauts de fréquences 
se produisant lors des transitions de mécanismes laryngés. Nous décrirons le phénomène physique 
et nous verrons que plusieurs techniques vocales issues de différentes traditions, utilisent de 
façons très différentes ces transitions. Nous décrirons en particulier le yodel qui utilise les voyelles 
d’une façon tout à fait particulière, et verrons dans quelle mesure cette technique peut être 
rapprochée des descriptions des chanteurs que nous avons recueillies et présentées au cours de 
la première partie. 

L’étude des transitions de mécanismes laryngés a nécessité l’enregistrement d’une nouvelle 
base de données, à laquelle ont contribué 7 des 21 chanteurs précédents. Nous décrirons cette base 
de données et présenterons les résultats qu’elle nous a permis d’établir. Nous nous intéresserons 
notamment à l’intervalle du saut de fréquence ainsi qu’à la fréquence de départ des transitions 
de mécanisme. Les résultats seront discutés et confrontés à la littérature. 

Finalement nous conclurons notre étude en résumant les principaux résultats. Ce travail 
cherche donc à contribuer à la compréhension des phénomènes physiques régissant la produc¬ 
tion vocale, en s’approchant d’une description aussi globale (et précise) que possible, et au plus 
proche de la (ou des) conceptions (s) que les chanteurs ont de leur voix. 
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Chapitre 1 

L’appareil phonatoire et son 
fonctionnement 


Les mécanismes de production de la voix sont longtemps restés très mystérieux. Depuis 
deux siècles environ, l’évolution très rapide de la médecine et des techniques d’investigation a 
permis de mieux comprendre comment le son était généré avant d’être rayonné dans le milieu 
extérieur. Nous allons voir dans ce chapitre quel est le fonctionnement physiologique de la 
production vocale, du moins de ce que l’on en sait aujourd’hui et qui concerne directement 
notre problématique. Les aspects acoustiques seront aussi étudiés, ainsi que les méthodes d’étude 
utilisées. 



L’ensemble de l’appareil vocal est schématisé figure 1.1. Sa physiologie globale est décrite 
par trois étages distincts : la soufflerie, le larynx et les résonateurs. La soufflerie correspond à 
l’ensemble de l’appareil respiratoire (les poumons et les muscles respiratoires). La gestion de la 
respiration dans le chant est un élément complexe et fondamental. Dans l’ensemble de notre 
travail, nous le ramènerons à la connaissance de la pression sous-glottique, qui correspond à la 
pression à l’intérieur de la trachée, juste en dessous du larynx. Cette pression influence direc¬ 
tement les caractéristiques vibratoires des cordes vocales, qui sont les éléments fondamentaux 
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(pour notre propos) constitutifs du larynx. Nous reviendrons en détails sur l’anatomie et le 
fonctionnement du larynx dans la partie 1.1, ainsi que les méthodes d’explorations du larynx 
et les modèles permettant de décrire sa fonction. Nous verrons dans la partie 1.2 comment dé¬ 
crire la vibration laryngée. L’onde sonore générée au niveau laryngé se propage ensuite dans le 
pharynx, dans la cavité buccale, ainsi que dans la cavité nasale si le voile du palais est abaissé, 
ce qui provoque une redistribution de l’énergie acoustique dans le spectre. Nous détaillerons le 
fonctionnement de l’étage résonantiel dans la partie 1.3. Enfin nous présenterons en partie 1.4 
quelles dépendances ou interactions ont été mises en évidence entre la vibration laryngée et le 
conduit vocal. 


1.1 Le larynx 


1.1.1 Description anatomique et physiologique du larynx 


Le larynx est un organe complexe situé dans le cou, au niveau de l’extrémité supérieure de la 
trachée. Sa fonction principale est d’obturer le conduit respiratoire lors de la déglutition. Nous 
ne présenterons ici que ses principaux éléments constitutifs, nécessaires à notre étude. 



Aryténoïde 


Cordes vocales 

Muscle crico- 
thyroïdien 



Cartilage thyroïde 


Anneau cricoïdien 
Cordes vocales 


Aryténoïde 


(a) 


(b) 


Fig. 1.2 - Représentation des principaux cartilages et muscles intrinsèques au larynx, (a) Vue 
de côté (b) vue de dessus. D’après Legent et al. (1975). 



ARRIERE 


Aryténoïd< 


Trachée 


-—Epiglotte 


AV 


ARRIERE 


AVANT 


( Larynx en abduction inspiratoirej ( Larynx en phonation ) 


Fig. 1.3 - Images laryng os copiques d’un larynx en abduction respiratoire et en phonation. 
D’après Husson (1962). 

Les principaux muscles et cartilages laryngés sont présentés figure 1.2. Le cartilage thyroïde 
est situé à l’avant du larynx, l’une de ses proéminence correspond à la pomme d’Adam. Les 
cordes vocales correspondent à deux replis pouvant, lorsqu’elles sont en contact, venir obstruer 
totalement le conduit respiratoire. Elles peuvent également s’ouvrir, comme présenté sur la figure 
1.3, par exemple lors de la phase inspiratoire. On appelle alors glotte l’espace entre les cordes 
vocales. 
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La musculature laryngée est habituellement décrite à travers deux catégories : 

1. la musculature intrinsèque, qui agit directement sur les cordes vocales et sur leur vibration. 

2. la musculature extrinsèque, qui concerne la position du larynx et sa mobilité. 

La musculature intrinsèque 

Les cordes vocales sont principalement constituées du muscle thyro-aryténoïdien, appelé éga¬ 
lement muscle vocal ou vocalis. La contraction de ce muscle influence directement les caractéris¬ 
tiques vibratoires des cordes vocales que sont, par exemple, leur tension ou leur masse vibrante. 
Il peut être étiré sous l’action antagoniste du muscle crico-thyroïdien. Ce dernier est attaché à 
une extrémité au niveau du cartilage cricoïde (situé directement au dessus du premier anneau 
trachéal) et à l’autre extrémité au cartilage thyroïde. Sa contraction provoque une bascule en 
avant du cartilage thyroïde comme présenté figure 1.2. 

Une structure en couche 

La figure 1.4 présente une schématisation de coupe verticale d’une corde vocale. Nous pouvons 
y lire que les cordes vocales ne sont pas constituées que du muscle thyro-aryténoïdien. Elles sont 
formées de plusieurs couches, dont le muscle vocal constitue la plus profonde. La couverture de la 
corde vocale est constituée d’une muqueuse, de l’épithélium ainsi que d’une couche superficielle. 
Le muscle vocal est séparé de cette couverture par un espace constitué d’une couche intermédiaire 
et d’une couche profonde. Cette structure particulière est importante car elle confère aux cordes 
vocales des propriétés vibratoires que nous détaillerons dans la partie 1.2. 


Couverture 


Transition 

Corps 


Épithélium 


Couche 

muqueuse 



Fig. 1.4 - Schématisation d’une coupe verticale de corde vocale. Adapté de Lacau St Guily et 
Roubeau (1994), d’après Hirano (1982). 


La musculature extrinsèque 

Le larynx est un organe souvent qualifié de «suspendu». En effet, il n’est pas constitué d’os, 
et est mobile par rapport au reste du corps, ce qui lui confère la mobilité nécessaire pour la 
déglutition, mais qui est également importante pour le chant. La position du larynx est régulée 
par un vaste ensemble de muscles extrinsèques dont les principaux sont schématisés figure 1.5. 
Remarquons notamment le muscle sterno-thyroïdien dont la contraction a pour effet d’abaisser 
le larynx, et le thyro-hyoïdien, qui a au contraire pour effet de le faire monter. L’os hyoïde, qui 
n’est pas solidaire du reste du squelette, est lui même est un élément clé dans la régulation de la 
position du larynx. Il est relié à la mandibule par le muscle mylo-hyoïdien, et est le support de 
la base de la langue. Des mouvements de ces organes peuvent donc entraîner des mouvements 
de l’os hyoïde. La contraction du muscle stylo-hyoïdien provoque une élévation de l’os hyoïde, 
celle du muscle sterno-hyoïdien l’abaisse. 

Nous retiendrons que la position du larynx est le résultat d’un équilibre complexe, pouvant 
être influencé par la forme de la langue ou la position de la mandibule. 
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muscle stylo-hyoïdien 

os hyoïde 

muscle homo-hyoïdien 
muscle thyro-hyoïdien 



thyroïde 


muscle sterno-hyoïdien 


muscle sterno-thyroïdien 


clavicules 


Fig. 1.5 - Appareil suspenseur du larynx. D’après Le Huche et Allali (1984) 

1.1.2 Méthodes exploratoires du larynx 

Depuis Garcia (1863) qui observait le larynx à l’aide d’un petit miroir qu’il maintenait au 
fond de la bouche du patient, de très nombreuses méthodes ont été développées pour observer 
l’appareil vocal. Nous nous contenterons de présenter les méthodes qui seront mentionnées dans 
cette étude. 


Estimation de pression sous-glottique 

La mesure directe de pression sous-glottique est une opération délicate, puisqu’elle nécessite 
d’introduire un capteur de pression dans la trachée, juste en dessous du larynx (par ponction 
trachéale). Cette méthode est donc très invasive et constitue un acte médical. Plusieurs cher¬ 
cheurs l’ont néanmoins utilisée pour effectuer des mesures en parole (Bucella et al. , 2000) et en 
voix chantée (Pillot, 2004; Randi, 2008). 

Dans la plupart des études, la pression sous-glottique est estimée à partir de la pression 
mesurée dans la bouche (pression intra-orale). Cette méthode nécessite un protocole précis, 
car dans le cas général (et en phonation), la pression dans la bouche est proche de la pression 
atmosphérique et non de la pression sous-glottique. Pour cela, les sujets doivent produire des sons 
du type «papa». La pression sous-glottique estimée lors de la phonation du /a/ est assimilée 
à celle mesurée dans la bouche pendant le «p», alors que la bouche était fermée et la glotte 
ouverte. Cette méthode est considérée comme une estimation fiable de la pression sous-glottique 
(Lôfqvist et al., 1982). 


La visualisation du larynx 

Dans le domaine médical, la laryngoscopie stroboscopique est très largement utilisée pour 
observer la vibration des cordes vocales. Cette méthode consiste à observer les cordes vocales 
à l’aide d’un endoscope introduit dans la bouche ou le nez (par fibroscopie) du chanteur (ou 
du patient), et à éclairer la glotte de façon discontinue selon le principe de la stroboscopie. Elle 
permet de visualiser une vibration glottique en même temps que d’écouter le son produit par 
le chanteur. Néanmoins la vibration observée ne correspond pas à un cycle glottique effectif du 
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fait de la stroboscopie, et cette méthode d’observation ne permet pas d’étudier les phénomènes 
transitoires. 

Pour pallier à ces problèmes, des systèmes d’acquisitions ont été mis en place, permettant 
d’enregistrer les images de la glotte à une fréquence allant à 4000 Hz ou 8000 Hz, ce qui permet 
d’étudier très précisément la vibration des cordes vocales : il est alors possible d’acquérir plusieurs 
images par cycle glottique. 

Pour étudier des productions chantées, ces méthodes présentent le désavantage d’être inva¬ 
sives. Introduit par voie orale, l’endoscope perturbe le chanteur, qui n’est plus libre d’articuler 
la voyelle qu’il souhaite. La qualité vocale est également fortement perturbée. La fibroscopie 
permet de limiter cet inconvénient, au prix d’une moins bonne résolution. 

L ’élect roglott ographie 

L’électroglottographie est une méthode d’étude non invasive des vibrations laryngées. Un 
électroglottographe est constitué de deux paires d’électrodes que l’expérimentateur positionne 
sur le cou du chanteur, de part et d’autre du larynx (Henrich, 2001). L’appareil génère un 
courant de très faible intensité (et d’intensité constante) et très haute fréquence qui circule d’une 
électrode à l’autre via le cou du chanteur, et délivre un signal correspondant à l’impédance du 
cou du chanteur. Cette impédance varie fortement en fonction de l’accolement des cordes vocales, 
et le signal électroglottographique (EGG) correspond à une estimation de la surface de contact 
des cordes vocales. 



(GCI) (GOI) 


Fig. 1.6 - Exemple de signal EGG et de sa dérivée. Tq correspond à la période fondamentale et 
Oq au quotient ouvert, défini comme le rapport de la durée de la phase ouverte par la période 
fondamentale. 

Nous avons représenté sur la figure 1.6 un peu plus d’une période d’un signal EGG ainsi que 
de sa dérivée (DEGG). Lors de la phase ouverte, la surface de contact des cordes vocales est 
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faible, donc le signal EGG est faible. Au contraire lors de la phase fermée, la surface de contact 
est plus importante, donc le signal EGG est plus grand. Comme décrit par Henrich (2001), les 
phases d’ouverture et de fermeture glottiques sont marquées par un changement rapide de la 
surface de contact des cordes vocales, d’où les pics observés sur les signaux dérivés. Les instants 
d’ouverture et de fermeture correspondent aux extremums du signal DEGG. La détection de ces 
pics permet d’estimer précisément la période fondamentale ainsi que le quotient ouvert. 

Le signal EGG, qui décrit indirectement la surface de contact des cordes vocales, permet de 
caractériser très efficacement les mécanismes laryngés. Nous reviendrons sur ce point dans la 
partie 1.2.1. 

1.1.3 Modéliser la fonction laryngée 

De très nombreux auteurs ont cherché à modéliser différents aspects de la fonction laryngée. 
Il est par exemple possible de modéliser l’action des différents muscles intrinsèques ou extrin¬ 
sèques du larynx en phonation (voir par exemple Vilkman et al ., 1996). Il est également possible 
de représenter la vibration physique des cordes vocales (Ishizaka et Flanagan, 1972). D’autres 
auteurs ont plutôt cherché à décrire le signal sonore résultant de la vibration glottique (Fant 
et al ., 1985). Le choix d’un modèle plutôt que d’un autre est effectué par les auteurs en fonction 
des problématiques qu’ils développent ainsi que de leur domaine de compétence. Compte tenu 
de notre problématique liant vibration glottique et voyelles, et de la littérature que nous citerons 
au cours de notre travail, nous allons maintenant présenter deux types de modélisations diffé¬ 
rentes : l’une, plutôt mécanique, représentant la vibration des cordes vocales, et l’autre, issue du 
traitement de signal, décrivant l’onde de débit glottique. 

La vibration glottique 

Le principe des modélisations de la vibration glottique consiste à définir un système et sa 
fonction à modéliser (le larynx, sa vibration), pour pouvoir déterminer des paramètres de sortie 
(onde de débit glottique, aire glottique) en fonction des paramètres d’entrée (pression sous- 
glottique, constantes caractéristiques du modèle, conditions initiales). 

Pour modéliser la vibration des cordes vocales, Titze (1994) a décrit une corde vocale par 
un oscillateur harmonique dont la masse, la tension et la raideur sont à régler pour approcher 
le plus possible une réalité physiologique. Le modèle le plus utilisé est le modèle à deux masses, 
introduit par Ishizaka et Flanagan (1972). Le principe de base de cette modélisation est présenté 
figure 1.7. Chaque corde vocale est modélisée par deux oscillateurs (de masse ml et m2) couplés. 
L’intérêt principal de ce modèle est de tenir compte du déphasage entre le bas et le haut de la 
zone d’accolement. 

D’autres modèles comme par exemple un modèle à 16 masses (Titze, 1973) ou des descriptions 
par éléments finis (Alipour et al ., 2000) ont été proposés dans la littérature, nous n’en ferons 
pas mention dans ce travail. Une revue bibliographique a été effectuée par Kob (2002). 

L’onde de débit glottique 

Alors que l’approche par modèle physique vise à établir l’onde de débit glottique (ODG) à 
partir d’un lot de paramètres décrivant la vibration glottique, les modèles de signaux ont pour 
finalité de décrire directement cette onde de débit glottique. Pour effectuer de la synthèse de 
parole en temps réel, il est nécessaire de contrôler le système par un nombre de paramètres le 
plus petit possible. Dans cette optique, l’onde de débit glottique est modélisée par une oscillation 
périodique, dont la période correspond à la fréquence de vibration glottique. Lorsque la glotte est 
fermée, l’ODG est nulle. La phase ouverte peut être décrite par une phase d’ouverture glottique 
(le débit augmente) et une phase de fermeture (le débit diminue). Plusieurs modèles d’ODG ont 
été proposés, et Doval et al. (2006) ont cherché à les unifier en décrivant l’oscillation par un jeu 
de cinq paramètres : 

- F, l’excitation maximale, correspondant à la vitesse de fermeture des cordes vocales 
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Fig. 1.7 - Schématisation du principe du modèle à deux masses. Adapté de Lucero (2005). 

- Tq, la période fondamentale 

- Oq le quotient ouvert, défini comme la durée de la phase ouverte relativement à la période 

- a m , le coefficient d’asymétrie, défini comme la durée de la phase d’ouverture relativement 
à la durée de la phase ouverte 

- Q a , le quotient de phase de retour, décrivant la vitesse avec laquelle l’ODG dérivée revient 
à zéro après la fermeture glottique. 



Fig. 1.8 - Représentation schématique d’une onde de débit glottique ainsi que de sa dérivée. 
Adapté de Doval et al. (2006). Remarquons que les phases d’ouverture et de fermeture glottique 
ne doivent pas être identifiées à celles définies sur le signal EGG (figure 1.6), les deux définitions 
proposées ne sont pas équivalentes. 

Ces paramètres sont tous définis dans le domaine temporel. Dans le domaine spectral, un 
tel signal correspond à un filtre passe bas, avec une décroissance de 6 dB ou 12 dB par octave 
dans l’aigu, en fonction des valeurs prises par Q a . Le quotient ouvert est connu pour avoir 
une influence sur la différence d’énergie des deux premières harmoniques de d’ODG. Pour plus 
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de détails concernant les influences spectrales de ces paramètres, le lecteur peut se reporter à 
Henrich (2001) ou à Doval et al. (2006). 


1.2 Les mécanismes vibratoires laryngés 



Fig. 1.9 - Spectrogramme d’un glissando effectué par une femme, couvrant les quatre mécanismes 
vibratoires laryngés. Adapté de Roubeau et al. (2009). (exemple sonore 1) 

Lorsque nous demandons à quelqu’un de produire un glissando des sons les plus graves aux 
sons les plus aigus (comme présenté figure 1.9), nous entendons plusieurs séquences successives 
séparées par des discontinuités de la fréquence vibratoire. Ces séquences sont produites par le 
sujet par quatre configurations vibratoires glottiques différentes, que nous appellerons méca¬ 
nismes vibratoires laryngés et dénommerons, du grave à l’aigu, mécanisme MO, Ml, M2 et M3. 
Ces mécanismes laryngés sont communs aux chanteurs et non-chanteurs, aux hommes et aux 
femmes, et même plus généralement à l’ensemble des mammifères (Castellengo et al., 1983). 

Le mécanisme MO permet d’émettre les sons les plus graves de l’ambitus vocal humain. 
Les cordes vocales sont courtes, épaisses et peu tendues. L’ouverture glottique est très courte 
(relativement à la période), et la pression sous-glottique est basse. En pratique, la fréquence 
vibratoire est souvent non maitrisée, sa variation est essentiellement fonction de la pression 
sous-glottique. A l’opposé, le mécanisme M3 est utilisé pour émettre les sons les plus aigus 1 . 
Les cordes vocales sont très tendues et allongées. Ce mécanisme a été peu étudié jusqu’à présent 
(Miller et Schutte, 1993). Nous allons maintenant décrire les mécanismes Ml et M2, qui sont les 
deux mécanismes laryngés utilisés dans le chant lyrique occidental. 

1.2.1 Caractérisation des mécanismes Ml et M2 
Caractérisation acoustique 

La figure 1.10 présente un glissando ascendant et descendant effectué par un ténor sur la 
voyelle /i/. À t = 2.5 s, nous observons sur le spectrogramme une discontinuité similaire à 
celle de la figure 1.9. Cette discontinuité du spectre sonore correspond également au saut de 
fréquence vibratoire qui se produit à cet instant, elle correspond à la transition du mécanisme 
Ml vers le mécanisme M2. Nous constatons que cette transition est accompagnée d’une chute de 
l’amplitude du signal EGG, ainsi que d’un saut de quotient ouvert qui résulte d’une modification 
de la forme d’onde du signal EGG. À t = 5.8 s, nous observons le phénomène inverse. 

Caractérisation physiologique 

La chute de l’amplitude du signal EGG traduit une diminution de la surface de contact des 
cordes vocales. En mécanisme Ml, les cordes vocales sont épaisses, et vibrent sur toute leur 
longueur. La masse vibrante est importante, car le muscle thyro-aryténoïdien participe à la 
vibration. La figure 1.11 présente un exemple de vibrations de mécanisme Ml, où l’ouverture 
s’effectue progressivement sur l’épaisseur des cordes vocales. Les aryténoïdes peuvent rester 


1. Le fait que le M3 soit un mécanisme à part entière distinct du M2 est sujet à caution 
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Fig. 1.10 - Glissando ascendant et descendant effectué par un ténor (T4), marqué par Vutilisa- 
tion des mécanismes laryngé Ml et M2. Voyelle : /%/. Du haut vers le bas, nous présentons le 
spectrogramme du son obtenu, la courbe de quotient ouvert (O q ), la courbe de fréquence fonda¬ 
mentale et le signal EGG (exemple sonore 2). 


accolés pendant la totalité du cycle ou non. Alors que la fréquence fondamentale augmente, 
le muscle vocal se contracte, entraînant une augmentation de la raideur des cordes vocales et 
une diminution de la longueur vibrante. Conjointement, le muscle crico-thyroïdien se contracte 
légèrement, venant ainsi contrebalancer la diminution de la longueur vibrante des cordes vocales. 
Cette action antagoniste du muscle vocal et du crico-thyroïdien explique qu’il y ait une limite 
physiologique du mécanisme Ml. 

Au moment où le chanteur atteint sa limite physiologique, les cordes vocales subissent un 
changement de configuration vibratoire. Le muscle vocal se découple de la vibration, et donc, 
cesse d’osciller, entraînant une modification subite des caractéristiques vibratoires des cordes 
vocales et le passage en mécanisme M2. Ce découplage est accompagné d’une légère bascule du 
larynx vers l’avant sous l’effet du muscle crico-thyroïdien (Lacau St Guily et Roubeau, 1994). 

Du fait du découplage, en mécanisme M2, le muscle thyro-aryténoïdien ne participe plus 
à la vibration glottique, ce qui se traduit par une surface de contact des cordes vocales plus 
faible comme nous pouvons le voir sur la figure 1.11, donc par une amplitude de l’EGG plus 
faible. L’augmentation de la fréquence fondamentale est alors essentiellement effectuée par la 
contraction du muscle crico-thyroïdien. 

Lors du glissando descendant, il se produit le phénomène inverse. Alors que l’activité du 
muscle crico-thyroïdien diminue pour permettre une baisse de la fréquence fondamentale, à partir 
d’une certaine fréquence, la masse vibrante n’est plus suffisante pour entretenir la vibration, le 
muscle vocal entre alors à nouveau en vibration, marquant le passage du mécanisme M2 au Ml. 

1.2.2 Mécanismes laryngés et pratique vocale 

En parole, l’utilisation des mécanismes laryngés dépend du sujet et du contexte. Dans la 
culture occidentale, les hommes emploient habituellement le mécanisme Ml, ainsi que la plupart 
des femmes. Ces dernières se servent parfois du mécanisme M2 de façon occasionnelle, voire 
(même si les cas sont de plus en plus rares) systématique. Les mécanismes MO et M3 sont le 
plus souvent utilisés dans un contexte précis. 

Dans le chant lyrique, les mécanismes Ml et M2 sont les plus utilisés. Les voix de basses, 
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Mécanisme Ml 



Corde 

vocale 


Mécanisme M2 



Corde 

vocale 


Fig. 1.11 - Configuration glottique associée aux mécanismes Ml et M2. En mécanisme Ml, les 
cordes vocales sont épaisses et vibrent sur toute leur longueur. En mécanisme M2, elles sont 
fines et ne vibrent pas toujours sur Vensemble de leur longueur. D’après Henrich (2001), adapté 
de Vennard (1967). 
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barytons et ténors utilisent habituellement le mécanisme Ml exclusivement. Un des aspects de 
l’entrainement vocal consiste, pour ces voix, à développer la tessiture disponible dans le méca¬ 
nisme Ml. Les voix de haute-contres ou de contre-ténors, de falsettistes, utilisent principalement 
le mécanisme M2. Elles peuvent utiliser le mécanisme Ml dans le grave de leur tessiture, mais 
cette utilisation dépend des chanteurs. 

Toujours dans le cadre de la technique lyrique, les femmes chantent principalement en mé¬ 
canisme M2. Les mezzo-sopranos peuvent néanmoins utiliser le mécanisme Ml, dans le grave 
de leur tessiture, ainsi que les sopranos (dans une moindre mesure). Enfin, les voix graves, les 
contre-altos, utilisent les deux mécanismes laryngés. 

En termes de mécanisme laryngé, l’entrainement vocal est donc différent en fonction de la 
tessiture du chanteur : certains chanteurs, essentiellement les hommes, cherchent à développer 
au maximum un mécanisme laryngé, alors que les voix hautes (contre-ténors, voix de femmes) 
développent essentiellement le mécanisme M2, mais une partie de leur entrainement vocal porte 
sur la transition entre les mécanismes Ml et M2. Dans la suite du manuscrit, nous parlerons 
de chanteurs de mécanisme Ml pour désigner les basses, barytons et ténors, et de chanteurs de 
mécanisme M2 pour désigner les voix de femmes et les contre-ténors. Ces derniers travaillent 
également la transition M1-M2. 

1.2.3 La zone commune aux mécanismes Ml et M2 
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Fig. 1.12 - Phonétogrammes par mécanismes laryngés d’un contre ténor (CTI). Voyelle : /a/. 

Lorsque nous explorons la dynamique vocale d’un chanteur sur toute sa tessiture en sépa¬ 
rant les mécanismes laryngés Ml et M2, nous obtenons un phonétogramme (voir chapitre 3) 
par mécanisme (figure 1.12). Les deux diagrammes ne sont pas disjoints: le chanteur dispose 
d’une large étendue fréquentielle commune aux deux mécanismes laryngés. Nous appellerons 
cette étendue «zone de recouvrement» ou «zone commune», elle nous permet de comparer des 
productions vocales de Ml et de M2 à hauteur et intensité identiques. Cette zone commune peut 
être observée chez n’importe quel sujet. Elle est localisée dans la même région fréquentielle chez 
les hommes et chez les femmes (Roubeau et al. , 2004). 

La voix mixte 

La zone de recouvrement des mécanismes revêt à nos yeux un intérêt particulier dans la mesure 
où elle permet aux chanteurs d’effectuer une transition de mécanisme à l’intérieur d’une plage 
de fréquence donnée et non sur une note fixe. Dans cette zone, les chanteurs développent un 
registre 2 particulier, appelé voix mixte (ou medium, middle voice) pour passer d’un mécanisme à 




2. Nous reviendrons sur la définition du terme «registre» en partie 1.2.5. 









18 


CHAPITRE 1. L’APPAREIL PHONATOIRE ET SON FONCTIONNEMENT 


l’autre ou pour imiter le timbre vocal résultant de l’utilisation d’un mécanisme tout en chantant 
dans l’autre. Cette pratique est particulièrement importante pour les chanteurs utilisant les deux 
mécanismes, compte tenu des exigences esthétiques musicales actuelles, consistant entre autres 
pour un chanteur à être capable de parcourir toute sa tessiture sans laisser entendre de transition 
brutale. 

Ce registre est appelé voix mixte, et a fait l’objet de plusieurs études au Laboratoire d’Acous- 
tique Musicale (Chuberre, 2000; Expert, 2003, 2007; Castellengo et al. , 2004; Lamesch, 2006). 
Ces études ont établi que : 

- la voix mixte est un registre situé dans la zone de recouvrement des mécanismes laryngés 
Ml et M2 en termes de hauteur et d’intensité. 

- la voix mixte peut être émise en Ml ou en M2, mais le mixage n’est pas effectué au niveau 
laryngé. La vibration glottique subit des adaptations en restant soit en Ml, soit en M2. 

(Castellengo et al. , 2007; Lamesch et al ., 2007) ont montré que des chanteurs maîtrisant 
parfaitement la voix mixte étaient ainsi capables d’obtenir des spectres similaires en Ml et en 
M2, et qu’il était très difficile, à l’oreille, d’identifier le mécanisme laryngé utilisé. Ces chanteurs 
sont donc capables d’obtenir un timbre vocal très similaire en utilisant deux vibrations glottiques 
différentes. 

1.2.4 Comment identifîe-t-on les mécanismes laryngés? 

De manière générale et pour une oreille entraînée, les mécanismes laryngés sont reconnais¬ 
sables à l’oreille chez la plupart des chanteurs (entraînés et non-entrainés). Le mécanisme MO est 
caractérisable par un son instable et grave; et le mécanisme M3 par un son extrêmement aigu. 
Pour distinguer les mécanismes Ml et M2, le premier indice est le timbre de la voix, associé à la 
fréquence fondamentale. Mais pour s’assurer que le chanteur est effectivement en Ml ou en M2, 
la forme d’onde de l’EGG ainsi que la valeur du quotient ouvert sont des indicateurs fiables, 
surtout lorsqu’elles sont observées lors des transitions. 

Lorsque l’identification du mécanisme laryngé est délicate, par exemple pour un chanteur 
professionnel dans sa zone de voix mixte, l’identification du mécanisme laryngé est possible en 
lui demandant d’effectuer un crescendo ou un decrescendo pour le faire sortir de sa zone de 
recouvrement de mécanismes, puis de lui demander de changer de mécanisme en augmentant ou 
diminuant la fréquence d’émission. Il se produit alors la transition de mécanisme caractérisable 
à la fois acoustiquement par le saut de fréquence, et à partir du signal EGG avec la variation 
d’amplitude du signal EGG ainsi que du quotient ouvert. 

Ajoutons que la plupart des chanteurs sont ou peuvent être, dans la plus grande partie de 
leur tessiture, conscient du mécanisme qu’ils utilisent. C’est dans la zone de recouvrement et 
pour des nuances piano que l’identification, chez certains chanteurs, peut s’avérer la plus difficile. 

L’ensemble de ces indications nous permet, dans la plus grande majorité des productions 
effectuées avec enregistrement simultané du signal EGG, d’identifier le mécanisme laryngé utilisé. 
Néanmoins il n’existe pas de critère permettant d’identifier avec une certitude absolue et dans 
100 % des cas le mécanisme utilisé. La raison principale est que chaque chanteur gère sa voix à 
sa façon, et cela se manifeste par exemple sur les valeurs que prend le quotient ouvert en Ml et 
en M2, sur sa corrélation avec l’intensité, la fréquence, en Ml et en M2. 

1.2.5 Mécanismes laryngés ou registres? 

L’utilisation de la terminologie des mécanismes laryngés n’est pas répendue au sein de la 
communauté scientifique internationale. La plupart des chercheurs utilise la terminologie des 
registres. 

Le terme «registre» provient du milieu musical. La mention la plus ancienne du terme «re¬ 
gistre» en référence à la voix que nous avons trouvée figure dans la méthode du conservatoire 
(Mengozzi, 1803, p. 2) : 

Nous tenons le mot REGISTRE des italiens. Ceux-ci entendent par ce mot un certain 
nombre de sons de la voix, dont le caractère diffère du caractère d’un autre nombre de 
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sons, lesquels forment un autre registre. [...] Les italiens appellent aussi Registre ce 
que les français nomment Jeu de VOrgue. Ce mot peut aider à définir et à comprendre 
le premier, si Von observe que la qualité du son des tuyaux de Vorgue compris dans 
ce jeu, est différente de la qualité des sons des tuyaux compris dans un autre jeu. 

Selon cette définition, les registres sont basés sur des différences de qualité de sons ou de 
caractère. Dans le domaine musical, cette définition du terme «registre» est toujours actuelle. 
Citons la définition du chanteur Richard Miller (1990) que nous prendrons comme référence. 
Selon lui, un registre correspond à une série de sons vocaux consécutifs de timbre homogène, 
distincte de séries voisines. Le nombre de registres a varié dans le temps, n’est pas le même 
dans toutes les cultures (même occidentales), de sorte qu’il règne une certaine confusion autour 
de ce concept. Les scientifiques y ont consacré de nombreuses études, et ils sont un des points 
les plus importants de la technique vocale. La difficulté principale est de définir objectivement 
un concept et une terminologie qui demeurent non consensuels (à l’échelle internationale) dans 
le milieu musical d’où il est issu. 

Néanmoins, dans le domaine scientifique, la définition du terme «registre» demeure problé¬ 
matique (Henrich, 2006). De nombreuses études ont cherché à appuyer la définition des registres 
sur une base physiologique. Une synthèse de ces travaux est présentée tableau 1.1. L’un des 
premiers est Garcia, qui dans la définition qu’il donne des registres, écrit explicitement qu’il 
souhaite traiter de la mécanique vibratoire des cordes vocales (Castellengo, 2005). Dans ces 
conditions, les registres peuvent s’apparenter aux mécanismes laryngés. Mais ils peuvent aussi 
être contradictoires avec l’expérience des chanteurs, c’est d’ailleurs ce qui est arrivé à Garcia 
qui a ensuite réintroduit un troisième registre aux deux qu’il avait observé. D’autres chercheurs 
(Titze, 1988; Sakakibara, 2003) basent leur définition à la fois sur le timbre et sur la physiologie 
de vibration des cordes vocales. 

Aujourd’hui la terminologie la plus employée consiste à parler de registre modal ou de poitrine 
et de registre falsetto chez l’homme. Ces deux registres, s’ils sont considérés au niveau laryngé, 
sont synonymes de mécanisme Ml et M2. Chez la femme, un registre mixte est en outre souvent 
cité, et nous ne pouvons pas a priori l’attribuer au mécanisme Ml ou au M2. Cette terminologie 

3. Nous n’avons pas nous même étudié les travaux auxquels nous faisons allusion dans ce tableau. Les références 
utilisées par les auteurs du tableau sont les suivantes: 

Muller, J. (1840), Physiologie du système nerveux ou recherches et expériences sur les diverses classes d’appareils 
nerveux, les mouvements, la voix, la parole, les sens et les facultés intellectuelles : Paris: chez Baillère. Deux tomes; 
traduit de l’allemand sur la 3rd ed. par A. Jourdan. 

Garcia, M. (1847), Mémoire sur la voix humaine : présenté à l’Académie des Sciences en 1840. 2nd ed. Paris: 
Imprimerie d’E. Duverger. 

Garcia, M. (1855), Observations on the human voice : In: Proceedings of the Royal Society of London. London: 
The Royal Society, 399-410. 

Garcia, M. (1861), Observations physiologiques sur la voix humaine : Paris: Asselin. 

Battaille, C. (1861), Nouvelles recherches sur la phonation : Paris: Académie des Sciences, V. Masson. 
Behnke, E. (1880), The Mechanism of the Human Voice : 12è ed. Warwick Lane, London: J. Curwen V Sons. 
Husson, R. et Djian, A. (1952), Tomographie et phonation: J. Radiol. Electrol. , 33:127-135. 

Van den Berg, J.W., Vennard, W., Burger, D. et Shervanian, C.C. (1960), Voice production: the vibrating 
larynx: Instructional Film. The Netherlands: University of Groningen. 

Hirano, M., Vennard, W. et Ohala, J. (1970), Régulation of register, pitch and intensity of voice. An 
electromyographic investigation of laryngeal intrinsic muscles: Folia Phoniat., 22:1-20. 

Hollien, H. (1974), On vocal registers: J. Phon ., 2:125-143. 

Colton, R.H. (1972), Spectral characteristics of the modal and falsetto registers: Folia Phoniat ., 24:337-344. 
Colton, R.H. (1973), Vocal intensity in the modal and falsetto registers: Folia Phoniat ., 25:62-70. 

Large, J., Iwata, S. et Von Leden, H. (1970), The primary female register transition in singing. Aerodynamic 
study: Folia Phoniat ., 22:385-396. 

Large, J., Iwata, S. et Von Leden, H. (1972), The male operatic head register versus falsetto: Folia Phoniat., 
24:19-29. 

Large, J. (1972), Towards an integrated physiologic-acoustic theory of vocal registers: NATS Bull., 29:18-40. 
Gay, T., Strome, M., Hirose, H. et Sawashima, M. (1972), Electromyography of the intrinsic laryngeal 
muscles during phonation: Ann. Otol. Rhinol. Laryngol. , 81:401-409. 

Lecluse, F.L.E. (1977), Elektroglottografie: thèse de doctorat, Utrecht, Rotterdam: Drukkerij Elinkwijk. 

Van Deinse, J.B. (1981), Registers: Folia Phoniat., 33:37-50. 

Kitzing, P. (1982), Photo- and electroglottographical recording of the laryngeal vibratory pattern during different 
registers: Folia Phoniat., 34:234-241. 
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Auteur 3 

année 

sujets 

protocole 

vocal 

Méthode d’obser¬ 
vation 

Registres 

Müller 

1840 

Larynx hu¬ 
main excisé 
(hommes) 

notes 

tenues, 

glissan- 

dos 

Observation 
directe avec 

variations de 

tension 

2 (Chest et falsetto) 

Garcia 

1840 

hommes et 

femmes 

notes te¬ 
nues 

soutien respira¬ 
toire 

2 pour les voix d’hommes 
et de femmes (poitrine et 
fausset-tête) 


1855 

hommes et 

femmes 

notes te¬ 
nues 

Laryngoscopie 

3 (Poitrine, fausset et tête) 

Battaille 

1861 

non précisé 

notes te¬ 
nues 

Laryngoscopie 

2 (Poitrine et fausset) 

Benhke 

1880 

hommes et 

femmes 

notes te¬ 
nues 

Laryngoscopie 

2 pour les voix d’hommes 
(thick et, thin), 3 pour les 
voix de femmes (thick,thin, et 
small) 

Husson 
et Djian 

Van den 
Berg 

1952 

1960 

hommes 
et femmes, 
chanteurs 
Larynx hu¬ 
main excisé 
(hommes) 

notes te¬ 
nues 

Tomographie 

Observation 

directe 

2 pour les voix d’hommes et 
de femmes (first et second re- 
gisters) 

Hirano 

et al 

1970 

hommes et 

femmes : 

2 pour 

chaque 

genre 

notes 

tenues et 

gammes 

EMG 

3 pour les voix d’hommes et 
de femmes: Chest, mid, head 
(hommes) ; Chest, head, et 
falsetto (femmes) 

Hollien 

1974 

hommes 

notes te¬ 
nues 

Perception, 
acoustique, 
rayons X, débit 
d’air 

3 (Puise, modal, et loft) 

Colton 

1972, 

1973 

hommes : 

chanteurs 

et non- 

chanteurs 

notes te¬ 
nues 

Acoustique et 

perception 

2 (Modal et falsetto) 

Large et 

1970, 

hommes et 

sons iso¬ 

Débit d’air 

3 pour les voix d’hommes 

al 

1972 

femmes 

paramé¬ 

triques 


(chest, head, et falsetto) 2 
pour les voix de femmes (chest 
et middle) 

Gay et 
al 

1972 

hommes et 
femmes 

notes te¬ 
nues 

Électromyographie 

2 (Chest, falsetto) 

Lecluse 

1977 

hommes 

notes te¬ 
nues 

Electroglottographi 

e2 (Chest, falsetto) 

Van 

Deinse 

1981 

hommes et 
femmes 

notes te¬ 
nues 

Electromyographie 

2 pour les voix d’hommes 
(chest, falsetto), 4 pour les 
voix de femmes (chest, head, 
little, et whistle) 

Kitzing 

1982 

hommes (1 
ent rainé, 

1 non- 

entrainé) 

notes 
tenues, 
glissan- 
dos et 

gammes 

EGG et photo- 
glottographie 

2 pour le chanteur entrainé 
(Chest et head), 2 pour le 
chanteur non-entrainé (chest 
et falsetto) 


Tab. 1.1 - Résumé des principales études effectuées sur les registres. Tableau traduit de Roubeau 
et al. (2009). 
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présente en outre le défaut d’introduire une différence entre les hommes et les femmes, qui est 
d’ordre culturel et non physiologique. Il arrive également de lire, notamment dans des travaux 
portant spécifiquement sur la voix chantée, la présence d’une voix mixte chez l’homme... qui 
peut être parfois comprise de différentes manières (nous avons fait l’expérience au cours de 
notre travail de thèse que le terme n’a pas le même sens en Allemagne et en France). 

Ces différentes définitions amènent une multitude de termes dont il est parfois difficile de 
comprendre à quoi ils se réfèrent. Môrner et al. (1963) en ont recensé plus d’une centaine, 
essentiellement de langue italienne, française, anglaise et allemande. 

Notre position terminologique 

Selon nous, la position adoptée par Sakakibara traduit une vision des registres relevant plus 
du sens commun que d’une expertise de la voix chantée, puisqu’elle ne tient pas en compte la 
capacité des chanteurs experts de produire un timbre vocal similaire en Ml et en M2 (ce qui est 
accompli dans le registre de voix mixte). 

Pour ne pas entrer dans un discours confus et polémique, nous avons choisi, dans la continuité 
des études menées au Laboratoire d’Acoustique Musicale par Roubeau, Castellengo et Henrich, 
d’utiliser la terminologie (neutre) des mécanismes laryngés pour décrire la vibration des cordes 
vocales, et d’utiliser le terme de registre pour nous référer au timbre de la voix. Nous choisissons 
ainsi de laisser au terme «registre» le sens premier qui vient du milieu musical. 

Comme nous le verrons tout au long de notre travail, ce choix pose des difficultés de compré¬ 
hension des publications internationales qui utilisent la terminologie des registres sans préciser 
à quel niveau les auteurs se situent. Dans la plupart des cas, nous pouvons implicitement com¬ 
prendre si la terminologie est utilisée en référence à la vibration laryngée ou au timbre de la 
voix, mais il s’agit d’une interprétation qui est la nôtre et non celle des auteurs. Pour cela, 
dans la suite de notre travail, quand nous nous référons à ce genre d’article, nous citerons la 
terminologie utilisée par les auteurs, ainsi que notre façon de la comprendre. Nous introduisons 
ainsi un peu de lourdeur dans notre manuscrit, mais nous pensons que cette lourdeur est gage 
de clarté conceptuelle et de respect des termes que les auteurs que nous citons ont utilisé. 


1.3 Le conduit vocal et les voyelles 

Après avoir décrit en détails la physiologie du larynx, son fonctionnement, les mécanismes 
laryngés, nous allons maintenant décrire le niveau résonantiel. Le son généré au niveau de la 
glotte sous l’impulsion de la pression sous-glottique se propage dans l’ensemble du conduit vocal. 
Celui-ci agit alors comme un tuyau dans lequel se propage une onde acoustique : il modifie la 
répartition de l’énergie dans le spectre en fonction de ses caractéristiques géométriques. Dans 
la parole et le chant, les sujets ont la possibilité de modifier la forme du conduit vocal, ce 
qui leur permet d’articuler les sons, de produire les différents phonèmes des langues. Nous nous 
intéresserons aux voyelles, qui dans le cas du chant, correspondent aux sons entretenus (alors que 
la plupart des consonnes ont un aspect plus transitoire). Pour produire les différentes voyelles, 
la position de la langue est un des paramètres cruciaux (voir par exemple figure 1.13, image 
de droite). Le palais mou permet également d’ouvrir ou de fermer le conduit nasal, donc de 
produire les voyelles nasales. 

La figure 1.14 présente le spectrogramme d’un son tenu, marqué par plusieurs changements 
de voyelles. Nous y constatons des traces foncées correspondant à des zones spectrales dont 
l’énergie est renforcée, et dont la fréquence varie avec les voyelles. Ces renforcements sont ap¬ 
pelées formants. Il est possible de définir une infinité de formants, mais en pratique les plus 
pertinents pour la reconnaissance de la parole sont les trois premiers (Fl, F2 et F3). La fré¬ 
quence de ces formants varie en fonction de la forme du conduit vocal (et notamment de la 
position de la langue). 

Les voyelles sont représentées dans un plan F1-F2 (triangle vocalique), comme c’est le cas 
figure 1.13. Les trois voyelles cardinales sont /a/, /i/ et /u/. Chaque voyelle correspond à une 
zone du plan plutôt qu’à un point. Par ailleurs, nous pouvons constater que certaines régions 


22 


CHAPITRE 1. L APPAREIL PHONATOIRE ET SON FONCTIONNEMENT 


F2 



Voyelles Images Spectre 

rayons-X 



W(). 


Fig. 1.13 - Gauche: exemple de triangle vocalique des voyelles du français. Droite: mise en 
relation de la forme du conduit vocal avec les fréquences formantiques. D’après Appelman (1967). 
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Fig. 1.14 - Spectrogramme d’un son tenu (f 0 = 118 Hz), chanté par un ténor (T3), avec plu¬ 
sieurs changements de voyelles (exemple sonore 3). 






















































1.3. LE CONDUIT VOCAL ET LES VOYELLES 


23 


peuvent être attribuées à plusieurs voyelles, en fonction du contexte ou de la fréquence du 
troisième formant. 

La relation entre formants et voyelle dépend du sujet. L’ensemble du triangle vocalique 
est modifié en fonction des dimensions géométriques du conduit vocal, ce qui explique que les 
fréquences des deux premiers formants sont plus basses pour les hommes que pour les femmes 
et pour les enfants. 

1.3.1 Observation et modélisation du conduit vocal 

L’essentiel des études portant sur le conduit vocal a pour objectif de décrire sa forme générale 
ou la fonction de transfert acoustique qui en résulte. Pour cela, différentes méthodes d’imagerie 
ont été utilisées. Dans un premier temps, les imageries par rayon X ont beaucoup été utilisées. 
Cette méthode permettait de visualiser les contours du conduit vocal, depuis le larynx jusqu’aux 
extrémités buccale ou nasale. Aujourd’hui il n’est plus possible de s’en servir à des fins de 
recherche pour des raisons sanitaires. 

Les plupart des études récentes utilisent l’imagerie par résonance magnétique. Cette méthode 
permet d’obtenir des coupes sagittales du conduit vocal très précises, ou même une reconstruc¬ 
tion en 3 dimensions du conduit vocal (à condition d’augmenter le temps d’exposition et de 
disposer du dispositif expérimental adapté). Elle permet d’effectuer des observations précises et 
relativement complètes de la forme du conduit vocal, sans risque connu pour le sujet. Les princi¬ 
paux inconvénients sont d’une part le temps d’exposition (plusieurs secondes) pour obtenir une 
reconstruction en 3 dimensions, et d’autre part, le fait que l’IRM ne détecte pas les os (donc 
les dents), ce qui nécessite de les ajouter sur les images enregistrées. Pour une description plus 
détaillée et une revue bibliographique de l’utilisation de ces appareils pour la parole, le lecteur 
pourra se référer à Story et al. (1996). 

Nous n’avons pas utilisé ce genre de méthode d’investigation dans le cadre de notre étude, car 
elles nécessitent un appareillage très lourd, et très contraignant pour le chanteur. Celui-ci doit 
accepter de chanter allongé et dans une ambiance sonore particulièrement désagréable. Certains 
scanners IRM, de type fermés, englobent complètement la tête du sujet, ce qui peut évidemment 
modifier considérablement la perception de sa voix. En bref, ce matériel n’est pas compatible 
avec des mesures acoustiques fines ou nécessite une grande expertise de la part du chanteur pour 
faire au maximum abstraction des contraintes expérimentales. 

Un modèle acoustique résultant 

La représentation acoustique du conduit vocal la plus utilisée est celle d’un guide d’onde, dans 
lequel se propage l’onde acoustique générée au niveau laryngé. Certaines propriétés acoustiques 
découlent directement de la géométrie du guide, qu’il est possible d’établir ou d’approximer 
à partir d’images de conduit vocal, soit en 2 dimensions (coupes médio-sagittales), soit en 3 
dimensions, ce qui permet évidemment une meilleure précision. La démarche expérimentale est 
schématisée figure 1.15. 

Dans un premier temps, une représentation du conduit vocal est établie à partir d’une suc¬ 
cession de cylindres de longueur fixe et de section variable. Le nombre de cylindres est variable 
en fonction de la précision souhaitée ou possible. Les données de première importance sont les 
sections des différents cylindres en fonction de la distance à la glotte. Elles sont représentées 
sur un graphique appelé fonction d’aire (cf. figure 1.15 (b)). Les lois de l’acoustique générale 
permettent alors d’établir la fonction de transfert du système(voir par exemple Story, 2004). 

1.3.2 Mesures des résonances du conduit vocal 

Une autre technique d’investigation beaucoup moins lourde est utilisée pour étudier le 
conduit vocal. Le principe consiste à disposer une source de débit acoustique au niveau de la 
bouche du chanteur et d’injecter dans son conduit vocal un signal large bande dont les fréquences 
sont rapprochés (moins de 10 Hz), pendant que celui-ci produit un son tenu. Un microphone 
placé au niveau de la bouche du chanteur enregistre alors le signal provenant du conduit vocal 
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Fig. 1.15 - Schématisation des trois étapes principales dans la modélisation du conduit vocal. 
Figures adaptées de Story et al. (2001). 


(constitué de la production vocale et du signal synthétique injecté dans le conduit vocal) et 
rayonné dans le milieu extérieur. La calibration de l’appareil permet de prendre en compte les 
effets de rayonnement, pour in fine, fournir un son sur le spectre duquel il est possible de relever 
les fréquences de résonances du conduit vocal. Une description plus détaillée a été publiée par 
Epps et al. (1997b,a). 

Cette méthode est très intéressante car elle permet de mesurer avec précision les résonnances 
du conduit vocal, donc de rendre compte d’ajustements résonantiels fins, quelle que soit la 
fréquence du signal glottique. Nous verrons un exemple d’utilisation de cette technique dans la 
partie 1.4.2. Par rapport à l’imagerie, elle a le désavantage de ne fournir que les fréquences de 
résonances et non la totalité de la fonction de transfert du conduit vocal. 

Une autre méthode, encore plus simple au niveau de l’instrumentation, consiste à demander 
au chanteur d’effectuer un bruit juste avant ou après la production vocale, en lui demandant de 
garder identique la forme du conduit vocal. Ce bruit peut consister en du MO, du souffle, il peut 
être également effectué lors de la phase inspiratoire ( ingressive voice). La fiabilité de la mesure 
repose alors sur l’aptitude du chanteur à garder effectivement la forme de son conduit vocal et la 
position verticale du larynx identiques sur la production voisée et sur celle bruitée. Miller et al. 
(1997) considèrent que ces méthodes sont fiables dans la mesure où le sujet est entrainé et dans 
la mesure des productions qu’ils ont étudiées (une voix d’homme, à une hauteur confortable). 
L’estimation formantique effectuée sur du MO a également été utilisée par Chuberre (2000). 

1.4 Voyelles et vibrations laryngées dans le chant 

Après avoir étudié séparément les aspects laryngés et résonantiels, nous présentons les des¬ 
criptions prenant en compte ces deux étages. Nous commencerons par décrire schématiquement 
le modèle source-filtre linéaire. Nous verrons ensuite une description mécanique faisant intervenir 
des interactions source-filtre. 

1.4.1 Le modèle source-filtre linéaire 

Le principe de base du modèle source-filtre est schématisé figure 1.16. Un signal glottique, 
l’onde de débit glottique (ODG), est convolué par un filtre décrivant le conduit vocal, le résultat 
étant lui-même convolué à un autre filtre décrivant le rayonnement aux lèvres. Ce dernier est 
souvent approximé à une dérivation (Flanagan, 1965). Dans le cadre de ce modèle, le filtre n’a 
donc aucune influence sur le signal de source. En première approximation cette hypothèse est 
assez cohérente, au moins dans le domaine de la parole où il a permis de nombreuses avancées. 

Technique d’analyse basée sur le modèle source-filtre 

De nombreuses techniques existent, permettant de séparer la source du filtre. La technique la 

















1.4. VOYELLES ET VIBRATIONS LARYNGÉES DANS LE CHANT 


25 


source glottique 



conduit vocal 



signal acoustique 



Rayonnement 
aux lèvres 



Fig. 1.16 - Schématisation du modèle source-filtre. Adapté de Henrich (2001). 


plus utilisée est le filtrage inverse. Pour cela, le filtre est souvent estimé par LPC (codage par 
prédiction linéaire, cf. Makhoul, 1975). 

Le principe consiste à déterminer le filtre auto-régressif du conduit vocal par la méthode des 
moindres carrés. Le connaissant, il suffit d’appliquer au signal rayonné le filtre inverse de celui 
obtenu pour obtenir l’ODG dérivée. Dans ce cadre là, les formants, définis comme les maximas 
de l’enveloppe spectrale dans la partie 1.3, peuvent être décrits comme des pôles de la fonction 
de transfert modélisant le conduit vocal, ou encore par une fréquence, une amplitude et une 
largeur de bande. 

Dans le domaine du traitement du signal, la théorie source-filtre linéaire a été abondamment 
développée (Fant, 1970) et a permis des innovations technologiques majeures dans le domaine du 
traitement de la parole. En revanche, ce mode d’analyse est mal adapté au chant pour plusieurs 
raisons. La première est que la LPC nécessite un échantillonnage spectral suffisant. Cela signifie 
que s’il n’y a pas d’harmonique dans la largeur de bande d’un formant, ce dernier ne pourra 
pas être détecté. Cette situation est assez fréquemment rencontrée dans le chant, lorsque la 
fréquence fondamentale est assez aigüe. En conséquence, le filtrage inverse est une méthode mal 
adaptée aux voix de femme, ou aux productions de mécanisme M2. Le deuxième inconvénient 
de la méthode est précisément de supposer une absence d’interaction entre la source et le filtre. 
Il n’est pas avéré que cette hypothèse soit valide dans le chant, comme nous allons le voir dans 
le chapitre suivant. 


1.4.2 Les interactions source-filtre 

La linéarité du modèle source-filtre pose question depuis lontemps (Flanagan, 1968). Chil- 
ders et Wong (1994) ont effectué une revue bibliographique des interactions étudiées dans la 
littérature. Ils ont par exemple relevé que la forme du conduit vocal avait une influence sur 
le coefficient d’asymétrie de l’onde de débit glottique. Fant et Lin (1987) ou Titze (2004) ont 
confirmé ces constatations portant sur le coefficient d’asymétrie. Titze (2004) a établi une in¬ 
fluence de la forme du conduit vocal sur le paramètre d’excitation maximale (appelée le MFDR, 
Maximum Flow Déclination Rate). 

Récemment, Titze (2008) a proposé un modèle physique permettant d’expliciter plusieurs 
phénomènes d’interactions source-filtre. Le raisonnement est fondé sur l’équilibre des pressions 
qui doit être effectué au niveau glottique : 


sous—glottique 


+ p, 


supra—glottique T Ptr an s—glottique 


= 0 


Les pressions sous- et supra-glottiques peuvent être exprimées en fonction de la géométrie des 
deux conduits. Il est ainsi possible d’obtenir une expression de l’impédance trans-glottique, et de 
décrire, par exemple, quelles régions fréquentielles sont plus ou moins favorables à la vibration 
glottique. Pour notre propos, l’intérêt de cette démarche réside dans le fait qu’il est possible 
de modéliser l’influence de la forme du conduit vocal (donc de la voyelle) sur l’onde de débit 
glottique. 
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Le formant tuning 

Titze (2008) montre que la vibration glottique est favorisée quand la fréquence fondamentale 
se trouve dans une région fréquentielle dont la réactance (la partie imaginaire de l’impédance) 
est positive (ou inductive). Cette situation est réalisée en particulier quand un des harmoniques 
(souvent le premier) se trouve juste en dessous de la fréquence du premier formant. 

Dans le cadre de la théorie source-filtre linéaire, la fréquence fondamentale (glottique) est 
supposée indépendante des fréquences formantiques. Différentes observations (Sundberg, 1975; 
Miller, 2000) ont néanmoins mis en évidence que ce n’était pas le cas, et plus récemment la 
mesure directe des fréquences de résonance du conduit vocal (Joliveau et al ., 2004b,a; Smith 
et al ., 2007) ont confirmé ces observations: les chanteurs positionnent effectivement leurs for¬ 
mants (essentiellement les deux premiers) juste au dessus d’un harmonique. Selon Sundberg, ces 
ajustements sont effectués au niveau de l’ouverture de la bouche (Sundberg et Skoog, 1997). Ce 
phénomène est appelé «formant tuning». Il est particulièrement important pour les voix aigües 
(sopranos). En effet à haute fréquence fondamentale les harmoniques sont très éloignées les unes 
des autres, donc les ajustements à effectuer sont très importants. 

Acoustiquement parlant, le «formant tuning» permet au chanteur de gagner de l’énergie 
acoustique. Titze (2008) a donc explicité, en outre, pourquoi cette situation était favorable à la 
vibration glottique. Néanmoins, si l’on considère maintenant la vibration glottique en termes de 
mécanismes laryngés, l’influence du conduit vocal sur la source n’a pas de raison d’être différente 
en Ml et en M2... L’influence de ce formant tuning sur la production laryngée est-elle la même 
en mécanisme Ml et en mécanisme M2? 

Quelle influence en fonction du mécanisme laryngé? 

La plupart des études portant sur ces interactions s’inscrit dans le domaine de la parole, 
et décrit un modèle d’onde de débit glottique de type Ml. Titze (2008) a proposé quelques 
éléments de réponse en décrivant les différences de mécanismes laryngés (dénommés registres 
modal et falsetto) à partir de la géométrie des cordes vocales : en registre modal, la glotte est 
convergente lors de l’ouverture et divergente ensuite, alors qu’en falsetto, elle reste divergente. 
L’auteur explique que les conduits sous-glottique et supra-glottique peuvent être chacun inductif 
(réactance positive) ou capacitif (réactance négative), ce qui fait quatre configurations possibles 
dont il discute l’adéquation avec les deux géométries glottiques proposées. Il montre qu’un 
conduit vocal inductif peut être favorable au falsetto comme au registre modal. Le conduit 
sous-glottique inductif et le supra-glottique capacitif est la pire situation pour le registre modal, 
or elle est rencontrée par exemple quand la fréquence fondamentale est au dessus de la fréquence 
du premier formant. Dans ces conditions, le système peut alors basculer vers le falsetto pour 
lequel cette situation est moins défavorable. 


1.5 Conclusion 

Au cours de ce chapitre, nous avons décrit l’anatomie du larynx, sa physiologie, les modèles 
descriptifs principalement utilisés, les méthodes exploratoires. Nous avons vu que le larynx peut 
vibrer selon quatre mécanismes, dont deux sont principalement utilisés en chant lyrique. Les 
voyelles sont générées au niveau du conduit supraglottique. 

Bien que certains aspects des interactions source-filtre soient déjà connus, peu d’auteurs 
ont exploré si l’influence du filtre est la même en Ml et en M2. Titze (2008) a montré qu’une 
simple différence de géométrie des cordes vocales entre les mécanismes Ml et M2 (dénommés 
registre modal et falsetto dans la publication) pouvait expliquer que les voyelles dont le premier 
formant est bas, sont plus favorables au mécanisme M2 qu’au Ml quand la fréquence de vibration 
dépasse celle du premier formant. Dans le même temps, cette situation est rarement rencontrée 
dans la mesure où les chanteurs adaptent les fréquences formantiques à la fréquence vibratoire 
(formant tuning). Le propos de notre thèse est de chercher à observer si les voyelles ont la 
même influence sur certains paramètres, en Ml et en M2. Nous avons choisi de travailler sur 
la dynamique vocale, sur différents paramètres glottiques et spectraux, sur les transitions de 
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mécanismes. Dans la conclusion générale de l’étude, nous verrons si nous pouvons tirer de notre 
étude un modèle général de compréhension des phénomènes observés. 

Mais auparavant, nous souhaitons donner la parole aux chanteurs. Quelle expérience ou 
connaissance ont-ils par rapport à la gestion des voyelles dans les différents mécanismes laryngés? 


CHAPITRE 1. 


L’APPAREIL PHONATOIRE ET SON FONCTIONNEMENT 
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Chapitre 2 

L’approche des chanteurs 


L’approche que les chanteurs ont de leur voix est différente de celle développée dans le milieu 
scientifique : les chanteurs l’inscrivent dans une pratique. 

L’essentiel du travail d’apprentissage du chant pourrait être décrit comme un travail d’ap¬ 
proche et d’affinement des sensations corporelles et auditives que le chanteur expérimente en 
chantant, pour arriver à satisfaire aux exigences vocales de son style musical avec la plus grande 
liberté d’interprétation possible. Une des principales difficultés des professeurs de chant est donc 
de trouver un moyen pour donner à l’élève la possibilité de se guider lui-même à partir de ses 
propres sensations, que le professeur ne peut percevoir ou dont il ne peut avoir l’intuition qu’à 
partir de sa propre expérience. Pour cela, élève et professeur doivent entre autres élaborer un 
langage commun. 

Pour décrire avec précision un certain aspect de la voix, les sciences naturelles adoptent 
habituellement une approche analytique : elles se focalisent sur un aspect précis, qu’il soit de 
nature physiologique ou acoustique. Elles décrivent donc la voix chantée à travers une multitude 
de paramètres, corrélés ou non entre eux. Le chanteur a une approche beaucoup plus globale : 
il se doit toujours, s’il modifie un élément, d’effectuer un ajustement ailleurs pour conserver un 
«équilibre vocal». Cette notion d’équilibre est par exemple tout à fait explicitée par certains pé¬ 
dagogues parlant par exemple d’accord phono-résonantiel (Ormezzano, 2000), d’appogio (Miller, 
1990), ou de façon encore plus générale, d’accord pneumo-phono-résonantiel (Tarneaud, 1961). 
Cette diversité d’approches a pour nous une conséquence tout à fait directe sur notre propos : si 
les chercheurs et chanteurs n’ont pas la même approche, et même, ne visent pas le même objet 
d’étude, alors le passage d’un champ disciplinaire à l’autre est une tâche délicate, que nous nous 
devons d’effectuer avec beaucoup de prudence, en précisant quelles descriptions relèvent de quel 
champ d’investigation chaque fois que cela est nécessaire. 

Nous allons, dans un premier temps, décrire un aspect de ce passage d’un champ disciplinaire 
à l’autre, à savoir les relations entre mécanismes laryngés et registres. Ensuite, nous établirons 
comment l’expertise des chanteurs et professeurs de chant se positionne par rapport aux relations 
entre mécanisme et voyelles. Enfin, nous présenterons la façon dont les chanteurs perçoivent les 
différents mécanismes et s’ils ont conscience d’une relation entre mécanismes et voyelle. Pour 
cela nous avons interrogé des chanteurs sur leur expérience. Nous présenterons donc les méthodes 
d’analyses mises en place, puis les résultats. 


Mécanismes ou registres? 

Nous avons décrit dans la partie 1.2 le concept physique de mécanisme laryngé, basé sur une 
description physiologique et acoustique. Comme nous l’avons souligné, ce concept a été développé 
dans un cadre scientifique et est appuyé sur des considérations acoustiques et physiologiques. Il 
est peu utilisé par les chanteurs qui emploient la terminologie des registres. 

Comme nous l’avons souligné (partie 1.2.5), les registres renvoient à des considérations de 
timbre. Pour produire ces différents registres, les chanteurs sont néanmoins amenés à utiliser 
pleinement les différences de qualité que peuvent leur apporter les mécanismes laryngés. Nous 
relèverons notamment les relations suivantes entre les principaux registres et les mécanismes 
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laryngés : 

- le registre de poitrine (ou voix de poitrine) est considéré comme étant produit par une 
vibration glottique de type mécanisme Ml 

- le registre de falsetto (pour les hommes), de tête (ou voix de tête) (pour les femmes) est 
considéré comme étant produit en mécanisme M2. 

Les registres occupent une place importante dans l’entrainement d’un chanteur lyrique. En 
effet, une exigence fondamentale de l’art lyrique est d’obtenir un timbre homogène (sans cassure) 
sur toute la tessiture utilisée, et cette exigence peut être difficile à réaliser par les chanteurs 
utilisant plusieurs mécanismes ou plusieurs registres. En effet, la perte de contrôle de la fréquence 
vibratoire qui marque le passage du mécanisme Ml au M2 (ou inversement) est un clair obstacle 
à surmonter pour les chanteurs utilisant ces deux mécanismes. C’est ce qui pousse certains 
chanteurs professionnels à considérer qu’une voix travaillée est une voix qui n’a plus qu’un 
registre (Appelman, 1967; Coffin, 1976; Miller, 1990). 

2.1 Mécanismes et voyelles : Analyse de traités de chant 

La science pédagogique des chanteurs est consignée dans les traités de chant. Nous avons 
donc étudié plusieurs traités et méthodes dans lesquels nous avons relevé les passages traitant 
d’une pédagogie incluant à la fois des éléments relatifs aux registres et aux voyelles. 

Si les registres sont important pour les chanteurs, même une lecture rapide de quelques 
traités de chant nous permettra de nous convaincre qu’il en est de même pour les voyelles. 
Ces dernières sont souvent utilisées pour chercher un timbre particulier, par exemple un timbre 
sombre. Miller (1990) mentionne par exemple un assombrissement des voyelles pour émettre les 
notes aigües. Vennard (1967), qui identifie les mécanismes laryngés Ml et M2(appelés heavy et 
light mechanisms ), ne suggère pas une utilisation privilégiée de certaines voyelles pour travailler 
un mécanisme donné. Coffin (1976) a établi une pédagogie complète basée sur la modification des 
voyelles avec la hauteur. Néanmoins l’utilisation des différents registres ne semble pas justifier 
selon lui une pédagogie différenciée pour les mécanismes laryngés (rien n’est précisé sur le sujet). 
Appelman (1967) développe bien le phénomène de «migration des voyelles», mais sans faire 
référence aux mécanismes (ni aux registres). 

La majorité des écrits que nous avons étudiés traitant des voyelles peuvent être interprétables 
en termes de «formant tuning». La terminologie des mécanismes laryngés est très peu utilisée 
(excepté les travaux de Expert, 2003, 2007), ce qui est normal dans la mesure où cette termi¬ 
nologie est récente et n’appartient pas au vocabulaire musical. Nous allons maintenant étudier 
les passages des quelques traités abordant la questions des voyelles en lien avec l’utilisation d’un 
mécanisme (ou d’un registre). 

Tosi 

Tosi (1723a) est souvent considéré comme le premier auteur d’une méthode de chant don¬ 
nant des indications précises en terme d’utilisation des registres. Celle-ci revêt pour nous un 
intérêt tout particulier, dans la mesure où Tosi était un castrat, et donc, utilisait certainement 
abondamment les deux mécanismes laryngés. A propos des voyelles et des registres, il écrit 1 : 

Celui qui aurait la curiosité de découvrir la voix de fausset chez un élève qui ne 
sait pas la faire entendre, doit faire attention qu’en se servant de ce registre, celui-ci 
exprime, avec plus de force et moins de fatigue, la voyelle i que la voyelle a, sur les 
notes aigües. (Tosi, 1723a, p. 35) 

Pour Tosi donc, la voyelle /i/ serait plus favorable (c’est à dire permet d’émettre un son 
plus fort à moindre investissement physique) que la voyelle /a/ en registre de falsetto (que nous 
attribuons au mécanisme M2), au moins sur les «notes aigües». 

1. Le texte original est: Chi fosse curioso di scoprire il falsetto in chi lo sa nascondere badi, che chiunque se 
ne serve esprime su gli acuti la vocale -i- con più vigore, e meno fatica dell’ -a-. (Tosi, 1723b, p. 42) Nous citons 
dans le texte la traduction de Lemaire (1874). 
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Garcia 

Garcia (1856) propose une pédagogie claire et différenciée en fonction du registre 2 travaillé. Le 
travail des différentes voyelles doit selon lui permettre de trouver différentes nuances de timbre. 
Ainsi, écrit-il, pour les voix de femmes et à propos de la voix de poitrine, il suggère de travailler 
entre si2-do3 et fa3, en cherchant un son timbré. Il ajoute 

Plus on montera, à partir du ré3, plus il faudra ouvrir le fond du gosier. La voyelle 
a sera aussi ouverte que possible [...]. Si dans les premiers essais, un son du registre 
de poitrine refusait de sortir avec la voyelle a, ou aurait recours à la voyelle i, qui 
détermine un rapprochement plus exact des lèvres de la glotte [...]. (Garcia, 1856, p. 

11) 

À propos de la voix de falsetto, il écrit : 

La qualité des sons est assez souvent enfantine; d’autres fois, elle est voilée. On 
corrigera le premier de ces défauts par le timbre sombre, avec la voyelle a demi o ; 
on combattra le second par le timbre clair, en se servant de la voyelle i. (Garcia, 

1856, p. 11) 

Garcia suggère l’utilisation de la voyelle /a/ pour travailler le registre de poitrine, ou la 
voyelle /i/ si le /a/ ne convient pas. Pour le falsetto, il ne suggère les différentes voyelles que 
pour corriger certains défauts possibles. À propos des voix d’hommes, et pour leur faire travailler 
la voix de poitrine, Garcia écrit : 

Les basses-tailles et les ténors attaqueront les sons de la même manière que les 
femmes. [...] Si l’on n’y prend pas garde, il deviendra très difficile de les faire sortir en 
timbre clair ; le larynx tend toujours à les sombrer. [...] Il faudra donc [...] employer 
le timbre clair en rendant l’a ou l’è de plus en plus ouvert. Il faut commencer à 
arrondir légèrement au lab2 pour les basses, aux si2-do3 pour les ténors. (Garcia, 

1856, p. 12) 

À propos du raccord des registres de poitrine et de falsetto, il écrit : 

Quant à l’union du registre de fausset avec celui de tête, nous nous contenterons de 
répéter qu’on l’obtient par la position qu’adopte le pharynx dans le timbre sombre et 
par le pincement de la glotte qu’exige la voyelle i.(Garcia, 1856, p. 12) 

Notons par ailleurs que Garcia, dans sa méthode, préconise de travailler l’union des deux 
registres en passant de l’un à l’autre sur la même note tenue (dans la zone commune). 

Delle Sedie 

Delle Sedie (1874) écrit : 

Lorsqu’on attaque un son élevé avec la voix de tête, et qu’on veut obtenir la résonance 
grave à l’octave, on s’expose à briser la voix et à faire un Couac ; pour l’éviter il faudra 
augmenter la pression de l’air de soutien placé dans le porte-vent de la trachée [...] 
de manière que le son puisse aisément et sans effort se soutenir tandis qu’il descend 
à la résonnance grave. La voyelle s’arrondit et devient presque O tandis que le son 
primitif est attaqué avec la voyelle È. (Delle Sedie, 1874, P • %3) 

Si dans cet extrait nous pouvons attribuer le «couac» que Delle-Sedie mentionne à une 
transition de mécanisme, alors l’auteur mentionne clairement une modification de la voyelle 
pour masquer la transition, et associe le /e/ au mécanisme M2 et le /o/ au mécanisme Ml. 

2. En 1840, Garcia défini les registres par une série de sons consécutifs et homogènes allant du grave à l’aigu, 
produits par le développement du même principe mécanique [...] quelles que soient d’ailleurs les modifications de 
timbre et de force qu’on leur fasse subir. Cette définition, fondée sur ses observations, correspond à celles des 
mécanismes laryngés, et d’ailleurs dans ce premier mémoire, Garcia ne définissait que deux registres, équivalents 
aux Ml et M2. Pour plus de détails sur la définition des registres et leur nombre chez Garcia, le lecteur peut se 
reporter à Castellengo (2005). 
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Des méthodes plus récentes 

Parmi les méthodes de chant plus récentes, peu font référence aux différences pédagogiques 
liées a l’utilisation des registres. Nous allons citer celles que nous avons relevées et qui proposent 
quelques éléments. 

Pour permettre aux femmes de trouver leur «mixture de tête», Miller (1990) suggère des 
vocalises à effectuer d’abord sur la voyelle [i], puis [e], [e], [o], [o] et enfin [u]. Pour faire travailler 
les hommes (en mécanisme Ml, donc), il privilégie les voyelles [a], [e] et [o] dans le médium 
(jusqu’au premier passage, selon ses termes), puis les voyelles [i], [e], [o] pour la partie plus aigüe 
(mais toujours en Ml). Notons que Miller n’apporte pas de justification au choix des voyelles 
qu’il effectue ici. 

Appelman (1967) n’a pas fait de remarque sur l’utilisation des voyelles et des registres, 
mais a en revanche proposé d’utiliser plutôt les voyelles postérieures pour travailler l’extension 
aigüe du mécanisme Ml chez les hommes : 

Ail transitions into the upper voice by the male singer are made with a closed vowel. 

The back vowels [u] and [o] and the central [a] are vowels that make this transition 
automatic. (Appelman, 1967, p. 92) 

Insistons sur le fait que l’auteur parle, selon nous, de l’extension du mécanisme Ml vers 
l’aigu et pas de la transition de Ml à M2. 

Coffin (1976) relate les écrits de Husler et Rodd-Marling (Singing: The Physiological Na¬ 
ture of the Vocal Organ, 1965) : 

The /A/ vowel requires the Tensor mechanism and the [u] and [i] require a Stretching 
action upon the vocal cords. Hence /A/ is best for low notes and the [i - a] and [u - 
a] are best for the highest notes. [...] This thinning-to-thickening occurs in ascending 
in each register. (Coffin, 1976, p. 88-89) 

Cette remarque est intéressante pour notre propos puisque le haut du mécanisme Ml cor¬ 
respond précisément à des cordes vocales très tendues (que les auteurs associeraient à la voyelle 
/a/), alors que le bas du M2 est obtenu avec des cordes vocales plus longues et plus étirées, ce 
qui correspondrait aux voyelles /u/ et /i/. En ce sens, cette remarque est cohérente avec celle 
de Tosi. 

Discussion 

Nous avons relevé ci-dessus quelques courts extraits de différents traités de chant portant 
à la fois sur les voyelles et registres. Nous avons sélectionné les passages que nous pouvions 
interpréter en termes de mécanismes laryngés. Une première constatation s’impose : aucune 
méthode de chant classique étudiée ici ne traite de la question comme d’une problématique clé 
pour l’enseignement du chant. Nous pouvons proposer quelques hypothèses pour expliquer ce 
constat : 

- soit la question est peu pertinente 

- soit la question fait référence à un savoir faire non explicité par les pédagogues, et non 
théorisé comme l’a été celui des registres. 

Néanmoins plusieurs auteurs mentionnent de façon plus ou moins développée des éléments 
s’y référant, et ces éléments sont assez cohérents entre eux. Si nous interprétons maintenant 
les écrits des professeurs de chant en termes de mécanismes laryngés, nous constatons que Tosi 
considère plus facile pour des étudiants chantant en mécanisme M2 de travailler d’abord sur le 
/i/ que sur le /a/. L’association entre le mécanisme Ml et la voyelle /a/, et entre le M2 et le 
/i/ semble aussi confirmée par Husler et Rodd-Marling, elle l’est de façon moins explicite par 
Garcia ou Miller. 

Il semble donc que la question des liens entre la voyelle et les mécanismes laryngés soit 
présente dans ces écrits, bien que non-théorisée et non justifiée. Nous allons maintenant présenter 
les conclusions d’un entretien effectué avec R. Expert à propos des associations entre mécanismes 
laryngés et voyelles. 


2.2. MÉCANISMES ET VOYELLE : ENTRETIEN AVEC UN CHANTEUR 
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2.2 Mécanismes et voyelle : Entretien avec un chanteur 


Robert Expert (2008), au cours d’un entretien personnel, nous a livré les différentes étapes 
de la pédagogie qu’il a suivie pour devenir contre-ténor, ainsi que le résultat d’observations des 
difficultés rencontrées par les élèves de sa classe de chant. Pour lui qui chante principalement 
en mécanisme M2, au début de sa propre formation, les voyelles fermées étaient les plus faciles 
au début de sa formation vocale, car c’est sur ces voyelles qu’il était le plus à même d’équilibrer 
l’ensemble de son instrument vocal. La voyelle /a/ était la voyelle la plus difficile à équilibrer 
a priori. Une fois cet équilibre trouvé sur les voyelles ouvertes, notamment dans le grave du 
mécanisme M2, il a été obligé de revisiter les voyelles fermées. Toujours selon R. Expert, pour les 
hommes (chanteurs en mécanisme Ml), la difficulté est plutôt pour eux de trouver un bon mode 
d’émission des notes aigües (en particulier en termes de gestion de la pression sous-glottique), 
ce qui est facilité par un travail sur les voyelles ouvertes. 

Il nous a également livré quelques observations, en tant que pédagogue de la voix, à savoir que 
dans un premier temps, les voyelles fermées comme le /i/ permettaient aux chanteurs utilisant 
principalement le mécanisme M2 (les contre-ténors et les femmes) de conserver un timbre brillant 
dans le grave du M2 (notons que cette observation est conforme à la remarque de Tosi sur le 
falsetto et la voyelle /i/). Quand aux chanteurs de Ml, l’extension de leur tessiture de Ml vers 
les aigus leur demandait plutôt de travailler dans un premier temps sur des voyelles ouvertes 
comme /a/ ou /o/ (ce qui est conforme à la remarque de Appelman). La gestion des voyelles 
était également primordiale pour chanter en voix mixte, en particulier le mixte de mécanisme 
M2. 

Le discours de R. Expert est intéressant car il explicite les relations relevées dans les traités 
que nous avons étudiés. Il recoupe parfaitement le discours de Tosi, ce qui est intéressant dans 
la mesure où les deux chanteurs en questions sont des hommes chantant en mécanisme M2. 

Si ces associations entre mécanismes laryngés et voyelles sont présentes dans le discours 
de certains chanteurs et pédagogues experts, sont-elles partagées par l’ensemble des chanteurs 
d’aujourd’hui? Pour répondre à cette question nous avons rédigé un questionnaire ciblé que nous 
avons proposé à plusieurs chanteurs, dont nous allons maintenant présenter les résultats. 


2.3 Le discours des chanteurs aujourd’hui : analyse de question¬ 
naires 


Nous avons cherché comment les chanteurs ressentent les différents mécanismes laryngés, 
et s’ils ont conscience d’une relation entre mécanismes et voyelles. Il s’agit donc d’étudier un 
savoir-faire, ce qui contribuera à nous informer pour la description physique que nous allons 
expliciter au cours de notre travail. Pour accéder à cette expérience subjective des chanteurs, 
nous avons mis en place un questionnaire, et nous avons procédé à une analyse linguistique de 
contenu, c’est-à-dire à un travail sur l’articulation entre les modes d’expression (la façon dont 
les gens parlent) et les représentations cognitives qu’ils manifestent (donc le contenu). 

Suite à la séance d’enregistrement pour la présente recherche (voir chapitre 4) à laquelle 
chaque chanteur a pris part, nous leur avons donc demandé de remplir un questionnaire qui est 
présenté dans la section 4.5. Ce questionnaire a été construit en deux parties : la première porte 
sur le protocole d’enregistrement que les chanteurs ont passé, la seconde sur leur ressenti par 
rapport aux mécanismes laryngés ainsi que sur les relations entre mécanismes et voyelles. Nous 
allons maintenant présenter les résultats de cette deuxième partie de questionnaire. La première 
partie de questionnaire sera présentée ultérieurement (partie 4.5) pour discuter de la validité du 
protocole d’enregistrement. 
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2.3.1 Méthode d’étude et d’analyse 
Les chanteurs 

21 chanteurs ont participé à renregistrement de la base de données (ils sont présentés en détail 
dans la partie 4), mais 16 seulement ont répondu aux questionnaires (8 femmes et 8 hommes). 
Il s’agit de chanteurs amateurs de niveau avancé ou de professionnels. Parmi les 16 chanteurs, 
5 exercent comme orthophonistes, et ont donc un rapport au chant particulier par rapport aux 
autres chanteurs, dans la mesure où ils ont une connaissance théorique supplémentaire. Deux 
chanteurs (CTI et T4) ont également une solide formation dans le domaine de la physiologie et 
acoustique de la voix. 

Le questionnaire 

Les questions posées aux chanteurs sont les suivantes : 

Nom : Prénom : 

Date de réponse du questionnaire : 

Connaissiez-vous la terminologie des mécanismes laryngés? 

Suite à la séance d’enregistrement, vous aurez constaté qu’au laboratoire, nous employons 
les termes de mécanismes laryngés. Si vous n’êtes pas familier avec cette terminologie, vous 
pouvez remplacer Ml par «registre de poitrine» et M2 par «registre de tète» (peut-être plutôt 
pour les femmes) ou «falsetto» (plutôt pour les hommes) dans la suite du questionnaire. 
Cependant, vous vous souviendrez qu’ils ne sont pas rigoureusement équivalents. 

[...] (partie du questionnaire présenté en partie 4.5) 

- Sur quels «critères» (ils peuvent être de toute sorte) vous basez-vous pour distinguer les 
mécanismes Ml et M2? Et les registres de poitrine et de tête (ou falsetto)? La question 
vaut en particulier dans la zone de passage... 

- Pensez-vous avoir une perception très tranchée des mécanismes Ml et M2, ou bien y 
a-t-il des «zones» (en terme de hauteur, de nuance...) dans lesquelles cette distinction 
devient floue? 

- Utilisez-vous la «voix mixte»? Si oui, comment la définiriez-vous ? Est-ce difficile pour 
vous, ou plutôt naturel? Est-ce plus facile sur certaines voyelles? 

- Selon vous, l’une des trois voyelles étudiées (/a/, /i/ et /o/ fermé) est-elle plus facile à 
chanter en Ml ou en M2? À crescender? À decrescender ? Avez-vous une explication à 
avancer, en termes de fonctionnement de votre appareil vocal, ou pouvez-vous décrire ce 
que vous ressentez? 

- Selon vous, quelles relations existent entre les voyelles et les mécanismes laryngés? 

- Avez-vous quelque chose à rajouter par rapport aux voyelles et/ou aux mécanismes 
laryngés ? 


L’analyse des questionnaires a été effectuée par Luiza Maxim et Danièle Dubois dans le cadre 
d’une collaboration entre l’équipe voix et l’équipe LCPE (Langage, Cognition, Parole et Ergono¬ 
mie) du LAM. Deux questions principales ont été étudiées, à savoir la façon dont les chanteurs 
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perçoivent les mécanismes laryngés et la relation entre mécanisme et voyelle. Pour étudier ces 
deux questions, nous avons porté une attention particulière à toutes les formes d’expression à 
travers lesquelles les chanteurs, soit manifestent leur ressenti, soit expriment la connaissance 
qu’ils ont des mécanismes. Les analyses linguistiques permettent d’identifier ce qui relève de 
cette connaissance subjective intuitive difficile à communiquer et des connaissances objectives 
acquises à travers leur formation. 

2.3.2 La perception des mécanismes par les chanteurs 

13 des 16 chanteurs ont déclaré connaître la terminologie des mécanismes laryngés. Les 
chanteurs ne la connaissant pas sont CT2, Bar3 et B2. Parmi ces trois chanteurs, seul CT2 
a répondu aux questions en utilisant la terminologie des mécanismes laryngés (qu’il a eu la 
possibilité de s’approprier au cours de l’enregistrement), les deux autres chanteurs ont utilisé la 
terminologie des registres, habituelle pour les chanteurs. 

L’analyse linguistique a permis de dégager trois axes auxquels les chanteurs se sont référés 
pour décrire la façon dont ils percevaient les mécanismes laryngés : 

Le premier axe concerne les sensations laryngées , il a été utilisé par 8 chanteurs. Citons 
par exemple MS2 3 : Sur moi, je distingue le Ml du M2 par mes sensations au niveau du 
larynx et du pharynx (je ne m’écoute pas avec mes oreilles). Nous pouvons également citer SI 
qui mentionne des sensations physiques laryngées. Ces deux chanteuses ne donnent pas plus 
d’indications sur la nature des sensations. S3 fait le même type de réponse : elle mentionne ce 
qu’elle ressent au niveau du larynx. MS3 mentionne que en Ml on sent le travail du larynx. 
S2, Tl mentionnent une activité laryngée plus marquée en Ml qu’en M2 : impression de quelque 
chose proche du serrage pour Ml et de quelque chose de plus aéré au niveau laryngé pour M2. 
Enfin CTI déclare avoir un ressenti clair des différences laryngées entre Ml et M2 : on sent bien 
que l’on passe d’une contraction musculaire type «biceps» en Ml à un étirement musculaire type 
«élastique tendu» en M2. 

Excepté CTI, tous ces chanteurs ont une perception non totalement explicitée de sensations 
vibratoires au niveau laryngé, qui ne seraient pas les mêmes en fonction du mécanisme laryngé 
utilisé. Quatre de ces chanteurs sont orthophonistes, et CTI a de solides connaissances en phy¬ 
siologie et acoustique de la voix ; la description de son ressenti constitue pour lui la vérification 
d’une connaissance. Les chanteurs s’expriment dans des termes convenus et appris au cours de 
leur cursus. 

Le deuxième axe concerne les sensations corporelles vibratoires globales. Citons B2 (qui 
utilise la terminologie des registres) : En registre de tète, elles [les impressions vibratoires] 
ne sont présentes que dans la partie supérieure du crâne, alors qu’en poitrine c’est tout 
le corps qui vibre. Nous pouvons aussi citer Tl : Ressenti personnel (juste au niveau des sen¬ 
sations) : Le mécanisme Ml me parait être en dessous du larynx et le M2 au dessus. Ici 
donc, les sensations ne sont plus localisées explicitement dans le larynx. Cet axe a été mentionné 
par huit chanteurs, qui ont globalement associé le mécanisme Ml à des sensations vibratoires 
localisées dans la poitrine et le mécanisme M2 à des sensations localisées plutôt dans la tête. 
Si l’on fait l’hypothèse que pour beaucoup de chanteurs, Ml est synonyme de voix de poitrine 
et M2 de voix de tête, la description faite ici prend tout son sens : la voix de poitrine vibre 
dans la poitrine et la voix de tête vibre dans la tête... Seuls deux de ces huit chanteurs sont 
orthophonistes (SI et S4), et CTI a cité cet axe comme étant basique. Cet axe est donc plus cité 
par des gens ayant une connaissance de savoir-faire et moins en référence à des connaissances 
théoriques sur la physiologie et l’acoustique de la voix. 

Le troisième axe correspond à la perception auditive. À nouveau, 8 chanteurs se sont référés 
à cet axe pour décrire leur conception des mécanismes laryngés. Trois d’entre eux ne donnent 


3. l’ensemble des citations des chanteurs apparaissent en italique dans le texte 
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aucun détail comme MS4 : Je me base [...] sur ce que j’entends. Sept autres chanteurs ont utilisé 
des adjectifs pour qualifier les deux mécanismes. Ainsi, pour Ml nous notons : plein, vibrant, 
plus brillant , pour M2 : plus léger (deux fois), plus de souffle, fin. Les chanteurs décrivent les 
propriétés différentes du son produit par l’utilisation des mécanismes laryngés par opposition de 
Ml et M2. Remarquons que deux chanteuses (S2 et MS2, deux orthophonistes) ont mentionné 
qu’elles utilisaient leur perception auditive pour reconnaitre les mécanismes chez les autres, et 
leurs sensations laryngées pour les reconnaitre chez elles. 

Conclusion 

L’analyse linguistique des réponses des chanteurs a permis de dégager trois axes utilisés par les 
chanteurs pour décrire leurs sensations par rapport aux mécanismes. Ces trois axes ne sont pas 
également évoqués par les chanteurs en fonction de leurs connaissances théoriques sur la voix. Ils 
permettent de mettre en évidence deux ordres de phénomènes exprimés : un phénomène subjectif, 
de l’ordre du ressenti (essentiellement le deuxième axe), et la description d’une objectivité apprise 
(premier axe). 

2.3.3 Quelle relation entre voyelles et mécanismes? 

Parmi l’ensemble des réponses obtenues, nous avons relevé quatre personnes T5, S4, Tl, MS2 
associant les voyelles fermées au mécanisme M2 et les voyelles ouvertes au mécanisme Ml. Sept 
autres chanteurs (SI, MSI, MS3, CTI, CT2, T4, Barl) ont associé la voyelle /a/ au mécanisme 
Ml et la voyelle /i/ au mécanisme M2 en termes de facilité d’émission. Citons par exemple Barl : 
Le /a/ est plus facile à produire en Ml surtout dans l’aigu , ou encore Tl qui écrit : J’ai eu des 
difficultés sur les voyelles fermées dans l’aigu (i, é) [de sa tessiture, donc du mécanisme Ml, 
note de l’auteur]. Seul un chanteur (B2) a effectué l’association inverse. 

Parmi la diversité des formulations recueillies, il apparait un consensus pour affirmer que 
le /a/ est plus facile à produire en Ml qu’en M2, et inversement pour le /i/. Ce consensus est 
partagé par cinq femmes et six hommes (dont les deux contre-ténors chantant en mécanisme 
M2), il est partagé par les chanteurs de mécanisme Ml et ceux de mécanisme M2. Parmi les 
personnes ne souscrivant pas à ce consensus, notons S3 et MS4 qui ont eu des difficultés avec la 
voyelle joj en Ml, alors que S4 a trouvé que le /o/ fermé est plus facile à chanter en M2 que 
les autres [voyelles] car c’est la voyelle la plus fermée. 

Cherchons maintenant à établir les raisons avancées par les chanteurs pour justifier leurs 
associations. Plusieurs chanteurs (Barl, MS2, T4, SI) n’ont donné aucune explication à leur 
association. 

MSI mentionne que /i/ semble moins réalisable en Ml surtout au niveau du cresc, une 
impression de serrage et de saturation arrive rapidement dans le cresc. 

MS3 dit que Peut-être que Ml est plus difficile avec le " i" qui est formé plus "devant". 

T5 dit que De façon générale, plus la voyelle est fermée, plus le Ml est délicat : l’ouverture 
générale de l’appareil vocal est gênée par la formation d’une voyelle fermée, notamment du fait 
de la position de la langue.[...] A contrario, de façon plus intuitive, c’est l’inverse pour le M2 
(voyelles fermées plus faciles à réaliser). 

Tl [chanteur de mécanisme Ml] : Tout vient pour moi de la position de la langue qui 
malheureusement monte vers le palais avec des sons fermés. Si la langue remonte, le larynx 
aussi. Les voyelles étant formées en grande partie par la langue. 

CT2 [chanteur de mécanisme M2] : C’est pour moi bien évidemment plus facile sur des 
voyelles que je pense maîtriser (arriver à trouver une " position de bouche " qui permet 
d’accéder à une maximum de vibrations et d’intensité) comme le I, le U ou le O. Le A est 
plus difficile. 

Pour expliquer le phénomène qu’ils mentionnent, les chanteurs ont mentionné des gestes par¬ 
ticuliers (l’ouverture de l’appareil vocal, la position de la langue, la position du larynx, devant). 


2.4. CONCLUSION 
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Nous constatons surtout que les explications ne concernent qu’un seul mécanisme, soit le mé¬ 
canisme utilisé. C’est cohérent avec le fait que la plupart des chanteurs ont une expertise dans 
un seul des deux mécanismes, et que les chanteurs utilisant les deux ont une expertise orientée, 
visant à homogénéiser le timbre au niveau de la transition de mécanisme. 

Nous constatons donc que la plupart des chanteurs ont effectué des associations entre méca¬ 
nismes et voyelles, en référence à leur pratique et aux difficultés qu’ils rencontrent. 

2.4 Conclusion 

Les relations entre voyelles et mécanismes que nous avons observées au moyen du question¬ 
naire sont relativement consensuelles, et recoupent les écrits de certaines méthodes de chant et 
du témoignage de R. Expert. Il semble bien que la voyelle /a/ soit plus «facilement» chantable 
en mécanisme Ml, et la voyelle /i/ en mécanisme M2. Or ce «facilement» est un terme utilisé 
par les chanteurs pour exprimer leurs difficultés, et ne renvoie pas directement, en l’état des 
connaissances, à une grandeur mesurable physiquement, puisque l’essentiel des descriptions du 
fonctionnement vocal postulent une indépendance de la source et du filtre, évacuant ainsi de fait 
toute possibilité d’influence du filtre sur la source, et ne prenant donc pas en compte, en séparant 
l’étude de la voix en différents étages, l’aspect global que les chanteurs expriment soit à travers 
des méthodes de chant, soit en répondant aux questionnaires (voir le ressenti des mécanismes 
dans l’ensemble du corps). 

Au cours de cette thèse, nous allons maintenant chercher des indices pouvant se rapporter à 
cette gestion globale du geste vocal à travers l’étude de l’influence de la voyelle sur la vibration 
laryngée. 

2.5 Bilan 

- Les chanteurs sont des experts de la voix chantée. Leur approche est ancrée dans l’expé¬ 
rience, et dans les sensations qu’ils ressentent. Leurs connaissances peuvent être théorisées 
et consignées dans des méthodes de chant, que nous avons analysées. Les auteurs ne laissent 
que peu de données explicitées concernant l’usage des mécanismes laryngés et des voyelles. 
D’une part ils n’utilisent pas la terminologie des mécanismes laryngés, et d’autre part, 
même en termes de registres, ils n’ont pas explicité de pédagogie différenciée en fonction 
de la tessiture du chanteur. 

- Nous avons interrogé Robert Expert, chanteur contre-ténor utilisant les deux mécanismes 
laryngés. Ce dernier nous a confié avoir eu plus de facilité sur les voyelles fermées en 
mécanisme M2 au début de sa formation vocale, puis sur les voyelles ouvertes ensuite. Son 
expérience de professeur de chant lui permet de constater le même type d’association chez 
ses élèves chantant en mécanisme M2, mais pas ceux chantant en Ml. 

- Nous avons fait une analyse linguistique de questionnaires portant sur les mécanismes 
laryngés et les voyelles. 

• Les chanteurs perçoivent les mécanismes laryngés à travers trois axes: des sensations 
corporelles globales (localisées dans la poitrine en Ml et dans la tête en M2), des 
sensations laryngés, des sensations auditives. La perception des chanteurs est influen¬ 
cée par la connaissance qu’ils ont des principes de la production vocale, et de leur 
situation (émetteur ou récepteur). 

• Les chanteurs associent la voyelle /a/ ou les voyelles ouvertes au mécanisme Ml et la 
voyelle /i/ ou les voyelles fermées au M2 en termes de facilité d’émission. 
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Deuxième partie 

Influence de la voyelle sur 
phonétogrammes 
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Chapitre 3 


Le phonétogramme : état de l’art 


Le phonétogramme est une représentation graphique de l’ensemble des possibilités vocales 
du chanteur en termes de hauteur et d’intensité (voir figure 3.1). 

Il a été introduit dès les années 1930 (Wolf et al ., 1935; Wolf et Sette, 1935) (pour une 
revue historique complète, voir Lamarche, 2009) ; les études portaient alors uniquement sur la 
limite supérieure. Plus tard il a été abondamment utilisé dans le milieu médical. Le terme utilisé 
pour désigner cette représentation graphique a beaucoup évolué, des termes synonymes sont 
«courbes vocales» (Calvet et Malhiac, 1952), «Stimmfeld» (champ vocal ou champ de liberté 
vocal) (Klingholz et Martin, 1983; Seidner et al ., 1985), ou encore «voice area», «voice profile», 
«FO-SPL profile». Dans de nombreuses publications il apparait sous le terme de «Voice Range 
Profile» (VRP, voir Bless et al ., 1992). 

Un exemple de phonétogramme est présenté figure 3.1. La chanteuse est une mezzo-soprano, 
nous pouvons lire qu’elle peut chanter du do2 au sib4, avec une intensité moyenne qui augmente 
avec la hauteur. Nous constatons aussi que la dynamique vocale (différence entre la limite su¬ 
périeure et la limite inférieure) varie en fonction de la note, elle est maximale autour du sib3, 
puis diminue quand la chanteuse va vers les sons plus graves ou plus aigus. Le phonétogramme 
permet entre autres de déceler si quelqu’un a une défaillance sur certaines notes (ce qui n’est 
pas le cas chez cette chanteuse professionnelle). Cet outil est donc largement utilisé pour étudier 
les voix pathologiques. 
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Fig. 3.1 - Phonétogramme global d’une mezzo-soprano (MS). Voyelle: /a/ 

Nous présenterons tout d’abord les méthodes de l’établissement et d’analyse d’un phonéto- 
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gramme. Puis nous décrirons quelques spécificités des phonétogrammes de chanteurs, ainsi que 
les phonétogrammes de paramètre. Enfin nous aborderons l’établissement des phonétogrammes 
par mécanismes laryngés et par voyelles. 

3.1 Acquisition et analyse d’un phonétogramme 

Comme l’usage du phonétogramme est très répandu dans les communautés scientifiques et 
médicales, il est apparu nécessaire de normaliser la procédure d’acquisition ainsi que sa repré¬ 
sentation graphique (Damsté, 1970; Schutte et Seidner, 1983). Les phonétogrammes sont habi¬ 
tuellement enregistrés à l’aide d’un microphone omnidirectionnel, placé à 30 cm de la bouche 
du chanteur, l’expérimentateur pouvant éventuellement visualiser en direct la forme de la figure 
obtenue pour contrôler que toutes les zones ont été explorées. 

3.1.1 Protocole: Phonétogrammes physiologiques et phonétogrammes chan¬ 
tés 

Le protocole d’enregistrement, donc la tâche à accomplir par les chanteurs, peut influen¬ 
cer le résultat final. D’une part, il n’est pas évident qu’un protocole constitué de crescendos 
et decrescendos donne le même résultat qu’un protocole constitué de notes tenues et attaquées 
à l’intensité maximale ou minimale, ou encore de glissandos. D’autre part en ce qui concerne 
la voix chantée, un choix fondamental est à effectuer : le phonétogramme doit-il représenter 
l’ensemble des sons qu’un chanteur peut produire, ou l’ensemble des sons qu’il est susceptible 
d’utiliser en pratique? La deuxième option suppose une certaine qualité de timbre qui n’est pas 
exigée dans la première. Cette distinction est au coeur des enregistrements phonétographiques 
depuis leurs débuts, puisque Wolf et al (1935) avaient déjà choisi de ne pas enregistrer les pro¬ 
ductions de «falsetto» des hommes, car ceux-ci ne les utilisaient pas en représentation. Coleman 
et Mott (1978) ont ensuite proposé de définir des phonétogrammes physiologiques et des pho¬ 
nétogrammes musicaux, mais prenaient en compte cette considération uniquement pour établir 
l’étendue fréquentielle à explorer. 



Fig. 3.2 - Phonétogrammes par mécanismes laryngés (sur la voyelle /a/) de MS, une chanteuse 
travaillant deux techniques vocales : le chant traditionnel breton et le chant lyrique. Sur la figure 
de gauche, nous avons ajouté la zone présentant les productions musicales correspondant à trois 
chants bretons (chantés en mécanisme Ml), et sur la figure de droite, Vensemble des productions 
émises lors de Vinterprétation d’un air de Rossini et d’un air de Schumann (en mécanisme M2). 

La figure 3.2 présente les phonétogrammes par mécanismes laryngés de MS (la réunion des 
phonétogrammes en Ml et en M2 permet d’obtenir les limites présentées figure 3.1). Ces pho¬ 
nétogrammes ont été obtenues en demandant à la chanteuse des crescendi et des decrescendi 
amenés jusqu’à leur limite en intensité. Nous pouvons donc les considérer comme des phoné¬ 
togrammes physiologiques. Nous y avons ajouté des zones correspondant à différents morceaux 
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chantés au laboratoire, dans les mêmes conditions expérimentales. La zone colorée de la figure 
de gauche correspond à de la musique traditionnelle bretonne (chantée en mécanisme Ml), celle 
de la figure de droite à du chant lyrique (mécanisme M2 pour cette chanteuse) (la chanteuse est 
professionnelle dans ces deux catégories). Nous constatons que le phonétogramme exploré selon 
notre protocole englobe les productions musicales et donne des informations supplémentaires 
aux intensités les plus faibles ainsi qu’aux extrêmes de la tessiture (grave-aigu). 

Lamarche (2009) a étudié l’influence de différents protocoles sur des phonétogrammes de 
femmes. Elle a établi un phonétogramme «physiologique» en demandant des glissandi ascen¬ 
dants et descendants répétés, et plusieurs phonétogrammes musicaux (performance Voice Range 
Profile) : un premier enregistré à partir de messe di voce (augmentation puis diminution de 
l’intensité sur une note tenue, avec une qualité musicale) à différentes hauteurs, un deuxième 
sur des vocalises de différentes intensités, et un dernier produit en chantant un air choisi par 
le chanteur. Lamarche a établi que le phonétogramme basé sur l’air était différent des autres, 
notamment avec une limite inférieure relativement haute. C’est à dire qu’en chantant leur air, 
les chanteurs ne descendaient pas au minimum de l’intensité. Néanmoins un tel phonétogramme 
reste très fortement caractéristique de l’air chanté (notamment en termes de tessiture). Les deux 
autres phonétogrammes musicaux étaient plus «larges», mais néanmoins nettement différents du 
phonétogramme physiologique. Ces considérations sont tout à fait en accord avec la figure 3.2. 

En fait, pour représenter l’utilisation qu’un chanteur fait de sa voix en concert, il serait peut 
être plus pertinent de porter sur le phonétogramme le pourcentage d’utilisation de chaque zone. 
Il est probable que la partie fortissimo serait plus utilisée que les zones pianissimo. 

Remarquons enfin sur la figure 3.2 que MS a produit des sons un peu plus forts dans le 
contexte chanté que lors du phonétogramme physiologique. Il est très vraisemblable que le 
contexte musical lui a permis spontanément de produire ce type d’émission qu’elle n’a pas 
trouvé pour le phonétogramme physiologique. Il est probable que la même chanteuse enregistrée 
sur une scène d’opéra devant une salle comble, aurait encore d’autres possibilités. Nous touchons 
aux limites des expériences de laboratoire, limites qu’il est bon de garder à l’esprit pour aborder 
l’ensemble du travail qui suit. 

Dans la suite de la thèse, le terme de phonétogramme se référera à un phonétogramme 
physiologique (sauf précision explicite contradictoire). 

3.1.2 Méthodes d’analyse du phonétogramme 
dB vs dB-A 

Nous avons tracé le phonétogramme de la figure 3.1 avec des notes sur l’axe des abscisses (ce 
qui revient à une échelle fréquentielle logarithmique), et en exprimant l’intensité en dB-SPL. 
Le dB-A a été beaucoup utilisé, il offre l’avantage d’atténuer les bruits basses fréquences qui 
sont fréquents dans un environnement médical. L’utilisation du dB-A a pour effet d’abaisser la 
limite inférieure (Gramming et Sundberg, 1988), donc de sur-représenter la partie pianissimo du 
phonétogramme. 

Décrire le phonétogramme 

Un certains nombre de paramètres ont été proposés pour décrire les formes des phonéto¬ 
grammes. Nous avons retenu la pente du phonétogramme (en dB/oct ou dB/demi-ton) qui 
permet de chiffrer l’augmentation globale de l’intensité en fonction de la hauteur, et l’aire du 
phonétogramme (en dB*demi-ton). La dynamique du chanteur est définie comme la différence 
entre la limite supérieure et la limite inférieure. Exprimée en fonction de la hauteur, elle per¬ 
met de décrire si le chanteur a beaucoup de possibilités à hauteur donnée. D’autres paramètres 
existent, notamment des descripteurs de forme. Ils sont définis par Sulter et al. (1994). 

Méthodes de comparaison 

Pour comparer les phonétogrammes de plusieurs sujets, il faut établir une base à partir de 
laquelle nous pourrons établir des comparaisons. Une méthode immédiate est de moyenner des 
phonétogrammes à fréquence donnée. Cette méthode a le désavantage de ne pas pouvoir décrire 


44 


CHAPITRE 3. LE PHONÉTOGRAMME : ÉTAT DE LART 


une grande population, au sein de laquelle il y a nécessairement des différences de tessiture. Pour 
y remédier, Hacki et al. (1990) ont proposé d’établir des phonétogrammes moyens par tessiture 
vocale. Pour cela, ils choisissent de ne retenir que l’ensemble des points phonétographiques at¬ 
teints par un pourcentage donné de leurs sujets (50 % par exemple). Ils ont utilisé cette méthode 
pour décrire des phonétogrammes moyens de sopranos et de contre-altos. Une autre méthode ini¬ 
tiée par Coleman et Mott (1978), puis développée par Schultz-Coulon et Asche (1988) et Sulter 
et al. (1994), consiste à décrire la tessiture du chanteur en termes de pourcentage de son étendue 
totale. Dans ce cadre, le phonétogramme est décrit par une limite supérieure, correspondant aux 
intensités maximales, et une limite inférieure (pour les intensités minimales) ; chacune échan¬ 
tillonnée en onze points régulièrement répartis (à 0%, 10%, ..., jusqu’à 100% de la tessiture). 
Cette méthode, appelée rescaling method (en anglais) permet de comparer les phonétogrammes 
de différents chanteurs à position donnée au sein de la tessiture (relativement à ses extremums). 
Elle a plusieurs désavantages : d’une part l’information de la fréquence d’émission est perdue, 
et d’autre part, les phonétogrammes peuvent être fortement déformés: ainsi le phonétogramme 
d’un chanteur couvrant une étendue d’une octave et demie aura-t-il la même «taille» que celui 
d’un chanteur couvrant trois octaves. 

Il n’y a pas de méthode parfaite pour comparer des phonétogrammes. L’expérimentateur doit 
choisir un type de représentation en fonction de ce qu’il souhaite mettre en évidence. La difficulté 
est de trouver l’invariant en fonction duquel nous souhaitons comparer les phonétogrammes (la 
fréquence ou le pourcentage de tessiture ci-dessus). 

3.2 Les phonétogrammes et les chanteurs 

Certains aspects de l’entrainement vocal (nous resterons dans la tradition lyrique occiden¬ 
tale) et des différences vocales entre hommes et femmes peuvent être décrites à l’aide d’un 
phonétogramme. 

3.2.1 Entrainement vocal 

Il existe de nombreuses façons d’étudier l’influence de l’entrainement vocal sur les phonéto¬ 
grammes. Deux façons d’aborder la question ont été développées dans la littérature : 

- comparer des phonétogrammes de chanteurs entrainés et de non-chanteurs. 

- enregistrer régulièrement et sur plusieurs années des phonétogrammes d’élèves étudiant le 
chant. 

Gramming et collaborateurs (Gramming, 1991; Akerlund et al ., 1992; Gramming et al ., 1988) 
ont abordé la question par la première approche. Ils ont enregistré des phonétogrammes de 10 
chanteurs, 10 non-chanteurs, 10 chanteuses et 10 non-chanteuses. Seule la voyelle /a/ a été utili¬ 
sée, et les phonétogrammes ont été moyennés après application de la rescaling method (cf. section 
3.1.2). Ils ne décèlent globalement pas d’influence de l’entrainement vocal chez les hommes, et 
une augmentation de la limite supérieure chez les femmes. Akerlund et Gramming (1994) ont 
montré que cette augmentation chez les femmes était liée à une augmentation très importante de 
la pression sous-glottique. Seidner et al. (1985) ont étudié les intensités maximales et minimales 
produites sur les voyelles /a/, /i/ et /u/ par 30 chanteurs, 30 étudiants en classe de chant et 
30 non chanteurs, répartis dans les six tessitures vocales (soprano, mezzo-soprano, alto, ténor, 
baryton et basse). Ils constatent que l’entrainement vocal aurait pour conséquence d’augmenter 
les intensités minimales et maximales chez les voix de femmes, et d’augmenter légèrement la 
dynamique chez les hommes par diminution de l’intensité minimale et augmentation de l’in¬ 
tensité maximale. Ces deux études ne donnent pas des résultats fondamentalement différents 
en dépit de protocoles d’études très variables. Gramming explique ses résultats en notant que 
les chanteurs masculins travaillent beaucoup à développer leur formant du chanteur, qui a une 
influence relativement faible sur le SPL, alors que les femmes cherchent plutôt à gagner de la 
puissance en alignant les formants sur les harmoniques, ce qui a une influence très importante 
sur le niveau SPL (notamment dans leur tessiture). La différence de stratégie serait alors liée à 
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la différence de tessiture. Sulter et al. (1995) ont étudié l’influence de l’entrainement vocal chez 
92 femmes et 47 hommes, également en utilisant la rescaling method. Ils ont établi que l’entrai¬ 
nement vocal se traduit par une augmentation de l’aire des phonétogrammes ainsi que, chez les 
femmes, une augmentation de la tessiture. Roubeau et al. (2004) ont étudié des phonétogrammes 
par mécanismes laryngés de 42 sujets, hommes et femmes, classés dans trois catégories vocales 
(non-entrainé, amateur et professionnel). Ils ont également décelé une augmentation de l’aire 
des phonétogrammes avec l’entrainement vocal, dans le mécanisme laryngé utilisé pour chanter. 
Ce résultat est également en accord avec les travaux de Konzelmann et al. (1989). 

Awan (1991) a adopté une démarche un peu différente: il a demandé à 20 chanteurs et 
20 non-chanteurs d’effectuer des sons filés (crescendo et decrescendo) sur différentes notes, sur 
la voyelle /a/, avec un impératif esthétique: les phonétogrammes obtenus seraient donc plus 
proches de phonétogrammes musicaux. Il a alors constaté une nette augmentation de l’étendue 
de la tessiture, ainsi qu’une augmentation de la limite supérieure et un abaissement de la limite 
inférieure avec l’entrainement vocal. 

Pour résumer, l’entrainement vocal semble donc porter à la fois sur un agrandissement des 
capacités vocales (notamment chez les femmes en termes de limite supérieure des phonéto¬ 
grammes, ce qui impliquera une augmentation de l’aire), ainsi qu’un élargissement de la zone 
musicalement utilisable. 

LeBorgne et Weinrich (2002) ont choisi la deuxième approche. Ils ont suivi pendant 9 mois 21 
étudiants en chant, et ont aussi utilisé la «rescaling method». Ils ont constaté que l’enseignement 
qui leur avait été dispensé s’était accompagné d’une augmentation de leur tessiture ainsi que 
d’un abaissement de la limite inférieure. Mürbe et al. (1999) ont également effectué une étude 
longitudinale de ce type, enregistrant les phonétogrammes de 25 personnes (5 sopranos, 5 altos, 
5 ténors, 5 barytons et 5 basses) à l’entrée en conservatoire et à la sortie (4 ou 5 ans plus tard). 
Ils trouvent que le niveau global augmente avec l’entrainement vocal, et que la corrélation entre 
hauteur et intensité diminue. 

Nous mettrons tous ces résultats en rapport avec notre propre expérience et commenterons 
ces données dans la section 5.3. 

3.2.2 Différences hommes - femmes 

Plusieurs différences phonétographiques entre les hommes et les femmes ont déjà été citées 
dans le paragraphe précédent. Les hommes chantent plus grave que les femmes, cette différence 
est due à un développement différencié du larynx au moment de la mue (Ormezzano, 2000). 
Plusieurs études ont comparé des phonétogrammes féminins et masculins (Sulter et al., 1994; 
Gramming, 1991), sans prendre en compte les mécanismes laryngés. Or dans le chant lyrique 
occidental, la différence majeure entre les hommes et les femmes est que les premiers chantent 
essentiellement en mécanisme Ml et les secondes en mécanisme M2. Donc si l’on souhaite étudier 
les différences phonétographiques entre hommes et femmes, il est impératif de prendre en compte 
les mécanismes laryngés, car dans le cas contraire les différences observées peuvent être dues aussi 
bien au sexe du chanteur qu’au mécanisme laryngé utilisé. Roubeau et al. (2004) ont effectué 
des phonétogrammes par mécanisme et ont montré que l’aire du phonétogramme du mécanisme 
utilisé est toujours plus grande que celle du mécanisme non-utilisé (ou secondairement utilisé), 
mais que la zone de recouvrement des mécanismes demeure équivalente chez les hommes et chez 
les femmes. Cette spécificité est à rapprocher de l’entrainement vocal, et serait peut être liée à 
un fondement culturel. 

3.3 Le phonétogramme de paramètre 

Le phonétogramme est un outil incomplet pour décrire l’ensemble de spécificités d’une voix. 
En particulier, le timbre de la voix n’y apparait pas directement, ce qui est une limitation 
importante dans l’étude de la voix chantée. Pour palier à cette limitation, Pabon et Plomp 
(1988) ont proposé une méthode d’enregistrement automatique du phonétogramme augmenté de 
paramètres acoustiques décrivant la qualité vocale. Graphiquement, ces paramètres apparaissent 
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sous forme d’un dégradé de couleur à l’intérieur des limites phonétographiques. Leur but étant 
de caractériser les voix pathologiques, les auteurs ont choisi d’étudier le jitter comme paramètre 
de perturbation, la différence d’énergie entre les bandes 0-1.5 kHz et 1.5-5 kHz comme estimation 
de la pente spectrale (cette méthode d’estimation est discutée en partie 7.1), et le niveau sonore 
au delà de 5 kHz comme une estimation du caractère soufflé de la voix (breathiness) . Plus tard, 
Pabon (1991) a ajouté à ces paramètres le shimmer et le facteur de crête (rapport, exprimé 
en dB et calculé sur une fenêtre de 50 ms, de l’amplitude du signal sonore par sa moyenne 
quadratique) comme un autre estimateur de la pente spectrale. 



25 50 J 00 200 5D0 1 DOO 2000 

Fréquence fondamentale [Hz] 


Fig. 3.3 - Exemple de phonétogramme de facteur de crête (l’échelle de couleur ou de gris va de 
3 à 8 dB). D’après Pabon (2004) 

Selon Pabon et Plomp (1988), l’utilisation de tels phonétogrammes permet de relever des 
changements de qualités vocales pertinents en termes de description des voix pathologiques. 
Elle permet en outre de visualiser les variations d’un paramètre donné à la fois en fonction 
de la hauteur et de l’intensité, et de comparer des valeurs de ces paramètres entre plusieurs 
phonétogrammes à hauteur et intensité donnée. Le seul inconvénient de cette représentation 
est qu’elle ne permet pas de rendre compte de l’éventuelle variabilité du paramètre étudié pour 
chaque point du phonétogramme. 

Les phonétogrammes de paramètres seront utilisé dans les chapitres 6 et 7. 


3.4 Phonétogrammes, mécanismes, voyelles 

À plusieurs reprises nous avons mentionné l’importance de la prise en compte des mécanismes 
laryngés pour l’établissement d’un phonétogramme. Nous allons maintenant détailler ce point 
précis, puis décrire l’influence de la voyelle sur les phonétogrammes. 

3.4.1 Phonétogramme et mécanismes laryngés 

Nous avons présenté dans la partie 1.2 ainsi que dans la partie 3.1.1 des phonétogrammes 
par mécanismes laryngés. La pratique consistant à distinguer les mécanismes laryngés lors de 
l’acquisition est peu répandue dans la communauté scientifique internationale, la plupart des 
auteurs (Calvet et Malhiac, 1952; Calvet, 1953; Coleman, 1993; Dejonckere, 1977; Klingholz et 
Martin, 1983; Komiyama et al. , 1984; Klingholz, 1992; Sulter et al. , 1994; Konzelmann et al., 
1989) repèrent un changement de registre par une inflexion de la limite supérieure du phonéto¬ 
gramme. Dans l’hypothèse où ces auteurs ont utilisé la terminologie des registres pour décrire 
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Fig. 3.4 - Phonétogrammes de mécanismes laryngés d’un contre-ténor (CTI, figure de gauche), 
et d’une mezzo-soprano (MS, figure de droite). Ml: bleu plein, M2 : rouge pointillé. Voyelle: 
/a/. Les mécanismes présentent une large zone de recouvrement (une octave et demie pour 
chaque chanteur). Les limites des phonétogrammes «globaux» (celles habituellement étudiées) 
sont tracées en traits larges, et les limites de la zone de recouvrement sont tracées en traits fins. 
Les barres verticales en tirets indiquent la tessiture do2-doJ±. 


la vibration laryngés, nous considérons que cette méthode présente deux défauts notables : 

- les décrochements de la limite supérieure peuvent être dus à d’autres phénomènes que 
des changements laryngés, par exemple l’éloignement d’un des premiers harmoniques du 
premier formant. 

- cette méthode laisse supposer que le «changement de registre» est effectué à une hauteur 
précise et identifiable. Or nous savons (partie 1.2) qu’il existe une large étendue fréquen- 
tielle commune aux deux mécanismes laryngés, ce qui se traduit sur le phonétogramme 
par une zone commune aux deux mécanismes laryngés. 

Les premiers chercheurs (Wolf et al., 1935) voulant représenter la voix chantée de barytons 
ont demandé au chanteur de ne pas produire de falsetto, ce qui, si l’on interprète cette consigne 
en termes de mécanismes laryngés, revient à effectuer un phonétogramme de mécanisme Ml. 

Colton et collaborateurs (Colton, 1970, 1973; Colton et Hollien, 1972) ont étudié les intensi¬ 
tés maximales et minimales pouvant être produites dans les registres modal et falsetto, à même 
fréquence. Ils ont constaté que l’intensité maximale était plus faible en registre falsetto qu’en 
registre modal. Si l’on interprète la consigne en termes de mécanismes laryngés, il s’agit de 
déterminer les limites supérieures et inférieures des mécanismes laryngés dans la zone de recou¬ 
vrement. Il ont travaillé exclusivement sur la voyelle /a/, et avec des sujets masculins, donc non 
entrainés à chanter en mécanisme M2. 

La figure 3.4 présente deux phonétogrammes, établis séparément en Ml et en M2. Cette 
procédure, également utilisée par Schutte (1980), Ragot (1998) ou Roubeau et al. (2004), permet 
de mettre en évidence l’étendue de la zone de recouvrement des mécanismes laryngés Ml et M2. 
Cette distinction permet d’effectuer des interprétations plus précises quant au lien entre la forme 
des phonétogrammes et la production vocale. Comme nous l’avons cité, Roubeau et al. (2004) ont 
ainsi montré qu’elle permettait de comparer plus objectivement des phonétogrammes d’hommes 
et de femmes. 

3.4.2 Phonétogrammes par voyelles 

La voyelle est connue depuis longtemps pour être un paramètre susceptible d’influencer les 
limites phonétographiques. Wolf et al. (1935) ont étudié les limites supérieures des phonéto¬ 
grammes de 5 barytons sur plusieurs voyelles dont /a/ et /i/. Ces limites obtenues sont situées 
à des intensités plus grandes sur /a/ que sur /i/. Stout (1938) a obtenu des résultats similaires, 
également avec des chanteurs masculins. Seidner et al. (1985) ont également enregistré des pho- 
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nétogrammes. Ils ont travaillé avec 90 sujets, hommes et femmes, et les voyelles /a/, /i/ et /u/. 
Ils ont constaté une influence de la voyelle chez les hommes (les limites inférieures et supérieures 
sont plus éloignées sur /a/ que sur /i/ et /u/), mais pas chez les femmes. Gramming et colla¬ 
borateurs (Gramming et Sundberg, 1988; Gramming, 1991) ont établi des phonétogrammes par 
voyelles (/a/, /i/ et /u/) pour 22 sujets féminins étudiants en orthophonie. Ils présentent des 
phonétogrammes normalisés en fréquence (rescaling method , cf. partie 3.1.2), et moyennés sur 
les 22 sujets. Ils obtiennent une limite supérieure 10 dB plus intense sur /a/ que sur /i/ et /u/ 
dans le grave alors que cette différence tend à se réduire vers les hautes fréquences. 

Gramming a également établi des phonétogrammes par voyelles pour un homme et pour une 
femme. Elle a entre autres étudié les voyelles /a/ et /i/. Elle constate que la limite supérieure 
du /a/ chez l’homme est supérieure à celle des autres voyelles, cette tendance se retrouvant dans 
une moindre mesure dans le grave de la tessiture de la femme, mais pas dans le haut. 

L’ensemble de ces études semble s’accorder pour affirmer une variabilité due à la voyelle sur 
les limites phonétographiques (ou du moins sur la limite supérieure) chez les hommes. Chez les 
femmes, cette tendance n’est pas nette, nous l’avons relevée dans les parties graves de leur pho¬ 
nétogrammes et pas dans les parties aigües. Or nous avons vu dans la partie 1.2 que les hommes 
utilisent le mécanisme Ml exclusivement (à l’exception des contre-ténors), alors que les femmes 
utilisent principalement le mécanisme M2 (dans le chant lyrique occidental). Qu’apporterait la 
prise en compte des mécanismes laryngés dans l’étude des phonétogrammes par voyelles? 

3.5 Orientation de l’étude 

L’étude de phonétogrammes par mécanismes laryngés et par voyelles nous permettra de 
comprendre s’il existe une corrélation entre l’influence de la voyelle sur la dynamique vocale en 
Ml et en M2, et les difficultés plus ou moins grandes qu’ont mentionnées les chanteurs à utiliser 
certaines voyelles dans certains mécanismes. La dynamique vocale est-elle plus grande sur /a/ 
que sur /i/ en Ml et inversement en M2? 

Nous avons en outre souhaité étudier l’incidence de la voyelle sur d’autres paramètres, acous¬ 
tiques (répartition de l’énergie dans le spectre) ou glottiques (quotient ouvert, amplitude du 
signal EGG, position verticale du larynx). Parmi ces paramètres (dont le choix sera justifié dans 
les chapitres 6 et 7), certains varient en fonction de la voyelle, d’autres en fonction du méca¬ 
nisme laryngé. Le phonétogramme par paramètre nous permettra de visualiser si l’incidence de 
la voyelle sur ces paramètres est la même en Ml et en M2. 

Pour cela, nous avons eu besoin de construire une base de données. Nous allons maintenant 
détailler la façon dont nous l’avons constituée et traitée. 

3.6 Bilan du chapitre 

Un phonétogramme est une représentation graphique de l’évolution de la dynamique vocale 
en fonction de la hauteur. Le protocole d’enregistrement et le dispositif expérimental influencent 
le résultat obtenu, d’où la nécessité de les normaliser pour rendre les études comparables. 

L’entrainement vocal et le sexe des chanteurs sont des facteurs de variations des phonéto¬ 
grammes. 

La voyelle influence également les contours phonétographiques, mais les études disponibles 
dans la littérature semblent montrer que cette influence serait différente chez les hommes et chez 
les femmes. Cette différence est-elle liée à l’utilisation des mécanismes laryngés? 

L’établissement de phonétogrammes par mécanisme laryngé permet de comparer les produc¬ 
tions de Ml et de M2 (dans leur zone commune), ou la dynamique dans les deux mécanismes, à 
même hauteur et même intensité. Cela nous permettra donc de comparer l’influence de la voyelle 
sur la dynamique vocale comme sur différents paramètres acoustiques et glottiques, en Ml et en 
M2. 
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Chapitre 4 

Constitution et traitement de la base 
de données 


Pour explorer l’incidence de la voyelle en mécanisme Ml et en M2, il est nécessaire de consti¬ 
tuer une base de données représentative de la production vocale chantée d’hommes et de femmes 
formés au chant classique. Notre protocole doit nous permettre d’établir les phonétogrammes par 
mécanisme laryngé et par voyelle. Il doit aussi nous permettre de comparer, à hauteur et inten¬ 
sité fixes, les valeurs prises par les paramètres acoustiques et glottiques associés aux productions 
chantées, que nous avons choisies. 

4.1 Le dispositif expérimental 

Le signal sonore est enregistré à l’aide d’un microphone de pression 1/2" (Brüel &; Kjaer 
4191), placé à 30 cm de la bouche du chanteur. Ce microphone est relié à un préamplificateur 
Brüel & Kjaer 2669 puis à un amplificateur Brüel & Kjaer Nexus 2690. 

Le signal EGG est obtenu à l’aide d’un électroglottographe EG-2-PC, dont la particularité 
est d’être munie de deux paires d’électrodes, ce qui permet de tenir compte des mouvements ver¬ 
ticaux du larynx. Outre le signal EGG, l’appareil délivre un autre signal de très basse fréquence 
représentant les mouvements verticaux du larynx (VLP, pour Vertical Larynx Position). Nous 
avons choisi de l’acquérir pour pouvoir étudier les variations de la position verticale du larynx 
des chanteurs. Pour cela, nous l’avons utilisé pour moduler en fréquence un signal sinusoïdal de 
1 kHz obtenu à l’aide d’un générateur de fonction (Beckman Industrial FG2A). Le signal obtenu 
est ensuite démodulé sous Matlab, et l’on récupère alors le VLP délivré par l’électroglottographe. 

Les trois signaux (sonore, EGG et VLP) sont acquis avec une carte son Metric Halo Mobile 
2882 connectée à un Macintosh. La modulation en fréquence du signal de position verticale du 
larynx est nécessaire car la carte son coupe les signaux de très basse fréquence, et donc filtre le 
signal que nous souhaitions acquérir. 



Fig. 4.1 - Schématisation du dispositif d’acquisition 

Outre le dispositif d’acquisition, nous avons utilisé un oscilloscope numérique pour visualiser 
le signal EGG lors de l’enregistrement. Ce dispositif nous a permis, dans certains cas, de confir- 
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mer ou d’infirmer le mécanisme laryngé que le chanteur pensait utiliser par l’observation de la 
forme du signal EGG. L’ensemble du dispositif est schématisé figure 4.1. 

Nous avons pris le parti d’effectuer les enregistrements dans une salle suffisamment grande 
pour que le chanteur et l’expérimentateur puissent s’y tenir, ce qui est plus confortable pour le 
chanteur et qui offre la possibilité d’interagir avec le chanteur en cours d’enregistrement. Cette 
salle est calme, isolée de l’extérieur et à faible réverbération (temps de réverbération à 60 dB : 
0.30 s à 1 kHz). 

4.2 Les chanteurs 

21 chanteurs ont gracieusement et bénévolement accepté de participer à notre étude. Ils 
pratiquent tous le chant régulièrement, à un niveau amateur avancé ou professionnel. Le tableau 

4.1 présente un aperçu succinct concernant leur tessiture, leur formation vocale. Précisons que 
plusieurs d’entre eux ont suivi une ou plusieurs autres formations musicales, en particulier ils 
ont appris un ou plusieurs instruments de musique ou exploré d’autres styles musicaux que le 
chant lyrique. La figure 4.2 présente l’étendue explorée au cours de l’enregistrement, dans les 
deux mécanismes laryngés. 

4.3 Protocole d’enregistrement 

4.3.1 Quel type de production vocale? 

Notre but étant à la fois d’obtenir des informations sur les potentialités maximales des chan¬ 
teurs et sur la qualité vocale à l’«intérieur» des phonétogrammes, nous avons choisi de demander 
aux chanteurs d’effectuer des crescendi et decrescendi. Les crescendi doivent commencer sur une 
nuance assez piano et s’achever sur la nuance la plus forte possible, et les decrescendi devaient 
aller d’une nuance assez forte jusqu’au plus piano possible (le seuil de phonation), de sorte que 
toute la gamme d’intensité soit bien produite au cours du protocole. 

4.3.2 Mécanisme laryngé 

Chaque chanteur a produit l’ensemble des productions demandées, successivement en méca¬ 
nisme Ml et en mécanisme M2 dans la mesure de ses possibilités. 

4.3.3 Voyelles étudiées 

Du point de vue méthodologique, il parait sensé d’étudier les trois voyelles formant les angles 
du triangle vocalique, c’est à dire les voyelles /a/, /i/ et /u/. Or l’objectif des chanteurs n’est 
évidemment jamais d’ajuster parfaitement les deux ou trois premiers formants avec des valeurs 
théoriques définies, mais bien plus d’affiner au mieux leur rendement vocal et la qualité de leur 
voix. Pour cela, les voyelles sont constamment modifiées par le chanteur, et certaines sont même 
très éloignées du point de vue phonétique ou articulatoire des voyelles parlées, comme la voyelle 
/u/. Cela n’empêche pas à l’auditeur d’entendre un /u/ dans certains cas, néanmoins beaucoup 
de chanteurs savent effectuer les ajustements nécessaires pour chanter cette voyelle qui, prise 
hors contexte, serait plutôt catégorisée comme un /o/. Pour cette raison, nous avons choisi de 
ne pas demander de /u/ mais plutôt un /o/ aussi fermé que possible. Les trois voyelles retenues 
sont donc /a/, /i/ et /o/ (fermé). Les voyelles nasales ne sont pas abordées. 

4.3.4 Tessiture 

Notre objectif étant de nous concentrer sur la zone de recouvrement des mécanismes laryngés, 
nous avons choisi la zone s’étendant de do2 (131 Hz) à do4 (523 Hz). Les phonétogrammes 
présentés seront donc qualifiés de phonétogrammes partiels. La tessiture a été explorée selon une 
échelle par tons, les productions demandées devaient donc être sur les notes suivantes : do2, ré2, 
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Tessiture 

Âge 

Profession 

Formation vocale 

Répertoire 

SI 

Soprano 

41 

orthophoniste 

conservatoire, cours privés 
(12 ans) 

oratorio, mélodies, opéra 

S2 

Soprano 

37 

orthophoniste 

cours privés (7 ans), en¬ 
semble vocal (11 ans) 

classique, baroque, médié¬ 
val 

S3 

Soprano 

lyrique 

légère 

24 

étudiante 

(chant) 

cours privés (2 ans), 
conservatoire (3 ans) 

opéra, mélodie, opérette, 
oratorio 

S4 

Soprano 

2 

33 

orthophoniste 

cours privés, chorale 

classique, chanson, comé¬ 
die musicale 

MSI 

Mezzo- 

soprano 

26 

étudiante 

(chant) 

conservatoire, choeur (20 
ans) 

lyrique 

MS2 

Mezzo- 

soprano 

28 

orthophoniste 

cours privés, chorale (7 
ans) 

gospel 

MS3 

Mezzo- 

soprano 

40 

chanteuse 

cours privés (12 ans), 
conservatoire (10 ans), 
choeur (4 ans) 

Mélodie, lieder 

MS4 

Mezzo- 

soprano 

26 

chanteuse ly¬ 

rique 

conservatoire (11 ans), 
choeur 

Baroque, classique, roman¬ 
tique 

CTI 

Contre- 

ténor 

43 

chanteur, pro¬ 
fesseur de chant 

CNR (4 ans), CNSM 
(1997), cours privés, mas¬ 
ter classes, nombreux 

prix 

de la renaissance aux mu¬ 
siques actuelles 

CT2 

Contre- 

ténor 

37 

enseignant 

choeur (21 ans), cours pri¬ 
vés 

du baroque au contempo¬ 
rain 

Tl 

Ténor 

lyrique 

léger 

29 

chanteur lyrique 

conservatoire et CNSM 
(sortie en 2006) 

opéra, lied, oratorio 

T2 

Ténor 

34 

Artiste lyrique 

conservatoires, CNR (8 
ans), cours privés (9 ans) 

Lyrique, mélodie, baroque 

T3 

Ténor 

24 

étudiant 

choeur (20 ans), cours pri¬ 
vés et conservatoire (2 ans) 


T4 

Ténor 

43 

enseignant- 

chercheur 

cours privés occasionnels, 
choeur (8 ans) 

classique, baroque 

Barl 

Baryton 

52 

orthophoniste 

ENM, cours privés 

musique ancienne, mélodie 

Bar2 

Baryton 

39 

artiste lyrique, 
pianiste 

cours privés 

baryton léger, mélodie, lied 

Bar3 

Baryton 

37 

chanteur 

CNR (sortie 2007) choeur 
(14 ans) 

varié, dominante ba¬ 

roque / renaissance 

Bar4 

Baryton 

22 

étudiant (chant) 

conservatoire, choeur (3 
ans) 

lyrique, mélodies, opéra, 
mélodie, lied 

B1 

Baryton- 

basse 

51 

chercheur 

cours privés (19 ans en 
tout), choeur (30 ans) 

classique, oratorio, mu¬ 
sique ancienne 

B2 

Baryton- 

basse 

46 

informaticien 

cours privé et choeur (20 
ans) 

plutôt musique ancienne 

B3 

Baryton- 

basse 

(chan¬ 

tante) 

41 

chanteur, chef 
de choeur 

cours privés (7 ans) 

médiéval et grégorien. Oc¬ 
casionnellement oratorios, 
musique baroque 


Tab. 4.1 - Présentation des chanteurs enregistrés pour le protocole d’étude. Signification des 
abréviations: CNSM: Conservatoire National Supérieur de Musique, ENM: Ecole Normale de 
Musique, CNR : Conservatoire National de Région. 
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mi2, fa#2, sol#2, la#2, do3, ré3, mi3, fa#3, sol#3, la#3, do4. Chaque chanteur a ainsi été amené 
à produire des crescendi et decrescendi sur ces notes dans chacun des deux mécanismes laryngés 
(dans la mesure du possible) et sur chacune des trois voyelles. En mécanisme M2, certains 
chanteurs (chanteuses) ont effectué des productions sur quelques notes supplémentaires pour 
aller jusqu’à leur deuxième passage. Ces productions supplémentaires n’ont pas été exploitées 
dans la thèse. L’étendue exacte explorée au cours de l’enregistrement est précisée, chanteur par 
chanteur et pour chaque mécanisme laryngé, dans la figure 4.2. 


si 


S2 S3 


S4 MSI MS2 MS3 MS4 CTI 


CT2 


P 


Ml M2 


«*> 




(U? 


ÿ » h*» 





Fig. 4.2 - Étendue de chaque chanteur, explorée au cours du protocole d’enregistrement, en 
mécanisme Ml et en M2 (il ne s’agit pas de l’ensemble de leur étendue vocale). Dans certains 
cas, plusieurs notes (graves ou aigues) sont présentées, il s’agit des limites obtenues pour les 
différentes voyelles étudiées. 


4.3.5 Productions en MO 

Immédiatement après chaque crescendo et decrescendo, le chanteur était invité à produire 
quelques impulsions glottiques dans le mécanisme MO (fry), en modifiant le moins possible la 
position articulatoire. Cette procédure vise à permettre une estimation des fréquences forman- 
tiques même sur les notes aigües pour lesquelles les méthodes habituelles (le filtrage inverse 
notamment) sont inefficaces. 

4.3.6 Déroulement de la séance 

A son arrivée, chaque chanteur avait la possibilité de s’échauffer vocalement. Le protocole 
lui était ensuite décrit. Ce protocole était organisé comme suit : chaque phonétogramme était 
découpé en quatre parties : le grave et l’aigu de chaque mécanisme laryngé. La note «jonction» 
entre le grave et l’aigu était habituellement le do3 (262 Hz), il était proposé au chanteur de 
l’adapter si nécessaire (notamment, elle pouvait ne pas être la même en Ml et en M2). Le 
protocole consistait ensuite à descendre ton par ton de cette note vers la limite grave, ou de 
monter vers la limite aigüe, dans le mécanisme laryngé choisi par le chanteur. Cette tâche 
était réalisée une première fois sur la voyelle /a/, puis sur /o/, puis enfin sur /i/. Ensuite 
le protocole poursuivait avec une autre des parties. L’ordre de ces parties était choisi par le 
chanteur. Lorsque le chanteur arrivait sur sa limite grave en mécanisme Ml ou sur sa limite 
aigüe en mécanisme M2, il avait la possibilité de progresser demi-ton par demi-ton plutôt que 
ton par ton. Le chanteur avait également la possibilité d’attaquer sa production vocale une tierce 
ou une quarte au dessus ou au dessous de la note visée, voire d’atteindre la note visée par un petit 
arpège, ce qui, pour certains d’entre eux, rendait la tâche plus facile. Ces petites vocalises ont 
été supprimées pour tout traitement postérieur. Enfin, juste avant de commencer le protocole, 
il lui était expliqué la nécessité des productions en mécanisme MO suivant chaque crescendo et 
decrescendo, et le chanteur avait la possibilité de s’entrainer autant que nécessaire pour arriver à 
modifier la production glottique sans modifier la forme du conduit vocal. Au cours de la séance, 
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les expérimentateurs pouvaient être amenés à demander au chanteur de reproduire certaines 
productions si la voyelle n’était pas considérée adéquate ou si le mécanisme laryngé n’était pas 
le bon (ou était douteux), ou encore si un autre des points du protocole n’était pas respecté. 
Par ailleurs, si certaines productions pouvaient soulever des discussions relatives à la technique 
vocale ou au ressenti du chanteur, ces discussions étaient encouragées. Elles n’ont néanmoins 
pas fait l’objet d’une étude spécifique. La durée d’un enregistrement était donc variable, de 45 
minutes à plus de 1 heure et demie. 


4.4 Traitement des données 

Les signaux sonore, EGG et VLP ont été codés sur 16 bits, à 44100 Hz ou 48000 Hz. L’en¬ 
semble des données a du être segmenté et étiqueté. Une première segmentation a été effectuée 
semi-automatiquement sous Praat (après vérification manuelle) et étiquetée, puis corrigée le cas 
échéant sous Matlab. L’ensemble des calculs et traitements a été effectué sous Matlab. 

4.4.1 Calibrations 
Calibration en intensité 

Le niveau sonore a été calibré à l’aide d’une production vocale d’intensité «plate», sans 
vibrato, et émise dans une qualité de voix «parlée». Le niveau de pression a été mesuré à 
l’endroit du microphone, ce qui nous a permis d’établir le gain de la chaine d’acquisition pour 
chaque séance. 


Normalisation du VLP 

Le signal de position verticale du larynx est enregistré à partir de l’électroglottographe. Tant 
que le larynx vibre, le signal EGG est facilement interprétable, mais en l’absence de vibration 
des cordes vocales, ce n’est plus le cas et il en est de même pour le signal de position du larynx. 
Le problème est qu’une position de référence habituellement choisie pour le calcul du VLP est 
la position de repos. La qualité de voix parlée demandée pour la calibration d’intensité visait 
à encourager le chanteur à maintenir son larynx dans cette position au repos. La production 
enregistrée permettait donc également de centrer le signal de position du larynx autour de cette 
valeur, considérée comme valeur de référence. Le VLP est calculé en normalisant le signal de 
position centré par le maximum de l’excursion obtenue lors de la session. 

VLp _ Positionlarynx - Positionlarynx ca i ihration ^ 
max(\Positionlarynx — Positionlarynx ca iii) rat i on \) 

Le VLP peut donc prendre des valeurs de -100 à +100, la valeur 0 correspondant à la position 
de calibration. 


4.4.2 Identification du mécanisme laryngé utilisé 

Nous avons vu dans la partie 1.2 qu’il est habituellement possible d’établir de manière fiable 
le mécanisme laryngé que le chanteur utilise, en particulier avec l’aide du signal EGG. 

Dans la plupart des cas rencontrés, le chanteur ainsi que les expérimentateurs tenaient pour 
évident le mécanisme utilisé par le chanteur. Mais sur certaines productions, l’identification 
devenait beaucoup plus délicate. Pour que l’étiquetage en termes de mécanismes laryngés soit 
correct, une validation était nécessaire. Cette validation a été effectuée en écoutant les sons, et 
en visualisant le spectrogramme, les courbes d’intensité sonore, de fréquence fondamentale, de 
quotient ouvert ainsi que l’amplitude du signal EGG. Seules les productions (ou les parties de 
productions) identifiées comme étant dans le mécanisme laryngé demandé ont été analysées au 
cours du présent travail. 
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4.4.3 Phonétogrammes de paramètres 

Au cours de cette thèse, nous avons cherché à représenter les variations de certains paramètres 
en fonction de la fréquence et de l’intensité. La méthode choisie consiste à représenter en couleur 
(ou en niveaux de gris) le paramètre étudié dans le phonétogramme (cf. partie 3.3). Dans la suite 
du manuscrit, le terme «phonétogramme de X» désignera le graphique représentant en couleur 
les valeurs que prend le paramètre X en fonction de la fréquence et de l’intensité. 

Implémentation 

L’implémentation de cette représentation est effectuée sous Matlab, et est inspirée des tra¬ 
vaux de Pabon & collaborateurs (Pabon et Plomp, 1988; Pabon, 1991, 1993). Son déroulement 
est schématisé figure 4.3. 

Les signaux de fréquence, d’intensité et du paramètre à étudier sont estimés sur l’ensemble 
de la base de données. Si nécessaire, ils sont rééchantillonnés à un pas de 5 ms. Ensuite, le 
plan phonétographique est discrétisé par pas de 1 dB * 1 demi-ton. Pour chaque case, la valeur 
médiane est calculée. 

Ensuite, un algorithme détecte les éventuels «trous» dans le phonétogramme, c’est à dire 
les cases situées à l’intérieur des limites du phonétogramme, mais n’ayant pas de valeur pour 
le paramètre étudié attribué. Une valeur leur est alors attribuée par linéarisation. Ces trous 
sont particulièrement présents chez des chanteurs ayant peu de vibrato. En effet le protocole 
ne prévoit qu’une production tous les tons et non tous les demi-tons. Nous avons néanmoins 
choisi de garder une discrétisation tous les demi-tons par souci d’homogénéité avec les études 
antérieures, et pour avoir une discrétisation assez fine en termes de hauteur. 

Enfin, la matrice obtenue est sur-échantillonnée d’un facteur deux, pour obtenir une discré¬ 
tisation de 1/2 dB par 1/4 de ton. Un filtrage médian est appliqué à l’ensemble pour rendre la 
lisibilité plus aisée. 

En définitive, nous obtenons un graphique dont le contour est précis au dB près pour l’in¬ 
tensité et au demi-ton près pour la hauteur. Les valeurs que prend le paramètre étudié sont 
discrétisées au 1/2 dB par 1/4 de ton près. La finalité de cette procédure n’est pas d’extraire des 
données objectives étudiables telles quelles par un traitement statistique, mais de nous fournir 
une représentation de l’évolution du paramètre étudié en fonction de la hauteur et de l’intensité. 



Fig. 4.3 - Schématisation de la démarche pour établir les phonétogrammes de paramètres. 


4.5 Le questionnaire 

A l’issue de la séance d’enregistrement, nous avons remis à chaque chanteur le questionnaire 
dont la première partie est retranscrite ci-dessous (la seconde partie a été présentée dans la partie 
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2.3). Nous avons demandé au chanteur de le remplir assez rapidement et de nous le renvoyer. Ce 
questionnaire a deux objectifs principaux: d’une part, de recueillir les critiques des chanteurs 
vis-à-vis du protocole lui-même, d’autre part, d’obtenir des informations quant à la perception 
que le chanteur a des mécanismes laryngés et quant au rôle de la voyelle dans cette perception. 
L’étude de ce corpus verbal doit permettre de confirmer ou d’infirmer des discussions privées 
effectuées avec quelques chanteurs (et a été présenté dans la partie 2.3). Nous allons maintenant 
présenter la première partie du questionnaire qui nous a permis d’effectuer une critique du 
protocole expérimental. Nous discuterons donc de la validité écologique du protocole. 


La première partie du questionnaire se présente ainsi : 


Nom : 


Prénom : 


Date de réponse du questionnaire : 

Connaissiez-vous la terminologie des mécanismes laryngés? 

Suite à la séance d’enregistrement, vous aurez constaté qu’au laboratoire, nous employons 
les termes de mécanismes laryngés. Si vous n’êtes pas familier avec cette terminologie, vous 
pouvez remplacer Ml par «registre de poitrine» et M2 par «registre de tète» (peut-être plutôt 
pour les femmes) ou «falsetto» (plutôt pour les hommes) dans la suite du questionnaire. 
Cependant, vous vous souviendrez qu’ils ne sont pas rigoureusement équivalents. 

Questions proches du protocole : 

- A-t-il été fatiguant? Trop long? 


- Le fry vous a-t-il perturbé? 

- Avez-vous pris conscience de quelque chose par rapport aux voyelles et/ou aux méca¬ 
nismes laryngés? Si oui, de quoi? 

- Avez-vous été à l’aise sur toute la tessiture et dans les deux mécanismes? Sur quelles 
notes et quelles nuances avez-vous des doutes quant au mécanisme utilisé? 

- Quand vous chantez, votre perception (ou ressenti) du mécanisme utilisé change-t-il 
avec la voyelle? 

- Etes-vous satisfait de votre enregistrement? Si ce n’est pas le cas, qu’est ce qui vous a 
gêné? 


- L’enregistrement vous a-t-il intéressé? Si oui, en quoi? 


Nous avons recueilli en tout 16 questionnaires. Les chanteurs n’ayant pas rendu leur question¬ 
naire sont T2, T3, Bar2, Bar4, B1 et B3. Nous avons en outre recueilli le questionnaire d’un 
ténor supplémentaire, que l’on appellera T5, qui ne figure pas dans la liste des chanteurs. Nous 
n’avons pas pris en compte son enregistrement car il n’a pas réussi à chanter en mécanisme M2, 
et donc ne nous permet pas de comparer l’influence de la voyelle sur les phonétogrammes en Ml 
et M2. Néanmoins nous avons conservé son questionnaire que nous avons dépouillé. T5 est un 
chanteur semi-professionnel. 

Nous nous proposons maintenant de présenter les analyses que nous avons effectuées à partir 
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de cette partie de questionnaire. De même que pour deuxième partie du questionnaire étudiée 
en section 2.3, cette analyse a été effectuée en collaboration à l’équipe LCPE du LAM. 

Analyse du questionnaire 

Parmi les 16 chanteurs ayant répondu au questionnaire, 8 l’ont trouvé fatiguant. Citons no¬ 
tamment S4, qui a trouvé le protocole éprouvant et demandant beaucoup de concentration , ou 
Tl qui déclare que personnellement cela a été mais il ne fallait pas 20 minutes de plus sur ce 
genre d’exercice. Au delà, je pense gu 3 on peut se faire mal. 3 seulement l’ont trouvé trop long. 
Ce résultat montre que les chanteurs ont très bien perçu l’exigence du protocole consistant à 
les pousser aux limites de leurs capacités en termes d’intensité, ce qui leur impose un certain 
décalage par rapport à leur pratique habituelle. Pour 12 chanteurs, les productions de MO n’ont 
pas été dérangeantes, certains chanteurs les ayant même appréciées comme S3 qui mentionne 
une sensation de massage pour les cordes à leur propos. 

En terme de compatibilité entre leur pratique ordinaire et leur expérience liée au protocole 
d’enregistrement, 5 chanteurs énoncent de manière plus ou mois explicite (de façon plus ou moins 
directe) le caractère non musical de l’enregistrement. Citons Barl : ce qui est intéressant c’est 
l’éloignement de ce type de production de celles réalisées dans un contexte musical , ou MS3 : Ce 
qui m’a le plus gêné c’est finalement ... de ne pas chanter. Ces chanteurs mettent en évidence 
le fait que le protocole n’était pas valide écologiquement, car il ne contenait pour les chanteurs 
aucune exigence musicale (artistique). Il s’agissait de tester leurs limites physiologiques, et non 
leur aptitude artistique. Les chanteurs ont donc répondu aux contraintes de l’expérience en met¬ 
tant en oeuvre des gestes vocaux qui ne sont pas nécessairement représentatifs de leur pratique 
quotidienne. 

Outre des difficultés mentionnées dans la partie précédente, 12 des 16 chanteurs ont exprimé 
des difficultés par rapport au protocole. Parmi les hommes, Barl, Bar3, B2, Tl (chanteurs de 
Ml) et CTI (chanteur de M2 principalement) se sont plaints de difficultés pour produire les 
sons pianissimo dans le mécanisme qu’ils utilisent. CT2 (chanteur de M2) et T5 (chanteur de 
Ml) ont mentionné la difficulté de chanter dans le mécanisme qu’ils n’utilisent pas. Parmi les 
femmes (chanteurs de M2), S2, S4 et MS3 se sont plaintes de difficultés en mécanisme Ml. 
MS3 mentionne même: Je m’appuyais comme une malade sur le larynx pour produire un son 
qui, d’après l’oscillo, correspondait à un Ml et j’ai d’ailleurs eu mal plusieurs jours après! 
Cette remarque souligne à nouveau le décalage entre une exigence contrainte par la logique de 
description des phénomènes physiques, et une logique de la pratique artistique du chant. 

Conclusion 

Nous avons observé une distance entre le protocole d’enregistrement et la pratique artis¬ 
tique des chanteurs. La base de données enregistrée est donc constituée de productions vocales 
chantées, partiellement décontextualisées, donc partiellement en dehors de la pratique vocale 
habituelle de certains chanteurs. 

Il est probable que si l’expérience était reproduite plusieurs fois ou que les chanteurs y 
étaient préparés, les résultats changeraient, peut être de façon notable pour certains d’entre eux. 
Ces constatations ouvrent néanmoins la possibilité d’une réflexion pour établir des protocoles 
plus écologiques pour les chanteurs, satisfaisant à la fois aux contraintes liées à leur nécessité 
d’interprétation et à celles liées aux impératifs d’une étude scientifique. 

4.6 Bilan du chapitre 

Nous avons enregistré une base de données de phonétogrammes par mécanismes laryngés 
(Ml et M2) et par voyelles (/a/, /i/ et /o/). Cette base nous permet de comparer l’influence 
de la voyelle en Ml et en M2 sur les contours phonétographiques, ainsi que sur les paramètres 
spectraux (répartition de l’énergie dans le spectre) et de source (Amplitude de l’EGG, VLP, O q ) 
que nous avons choisis. 

- 21 chanteurs, professionnels ou amateurs avancés, ont participés à l’étude (8 femmes et 13 
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hommes). 

- La tessiture explorée est la zone commune aux mécanismes Ml et M2 (de do2 à do4). 

- Les deux mécanismes et les trois voyelles sont enregistrés successivement (six phonéto- 
grammes par chanteur en tout). 

- Les chanteurs ont effectué des crescendi et decrescendi, ton par ton. 

- Chacune de ces productions est suivie par quelques impulsions produites en MO en main¬ 
tenant la forme du conduit vocal, pour permettre une estimation formantique fiable. 

- Les chanteurs ont rempli un questionnaire à l’issue du test, leur permettant de commenter 
la séance. Pour plusieurs chanteurs, le protocole s’est révélé éloigné de leur pratique vocale. 
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Chapitre 5 

Voyelles et limites 
phonétographiques 


Dans ce chapitre nous présentons les limites phonétographiques calculées sur la base de 
données ainsi que les écarts types observés sur ces limites, en fonction de la hauteur, de l’intensité, 
de la voyelle et du mécanisme laryngé. 

5.1 Incidence de la voyelle sur les limites phonétographiques 

Les phonétogrammes par voyelle et par mécanisme ont été établis pour chaque chanteur. Des 
phonétogrammes moyennés sur tous les hommes d’une part et toutes les femmes d’autre part 
sont présentés au cours de cette section. Pour chaque ton, l’effectif minimal est de 30% du nombre 
de chanteurs par catégorie (soit 4 pour les hommes et 3 pour les femmes). Les phonétogrammes, 
détaillés pour chaque chanteur, sont disponibles en annexe B. 

5.1.1 Phonétogrammes par mécanisme et voyelle: résultats généraux 

La figure 5.1 montre les phonétogrammes moyens, présentés séparément en fonction du sexe, 
du mécanisme laryngé et de la voyelle. Les phonétogrammes moyens des hommes sont présentés 
sur la colonne de gauche, ceux des femmes sur la colonne de droite. Les deux mécanismes laryngés 
ont également été séparés pour une meilleure lisibilité. Ainsi sur chacun des 4 diagrammes sont 
représentées les trois limites supérieures et inférieures des phonétogrammes moyens pour chacune 
des trois voyelles étudiées. 

Tessiture représentée 

Comme nous l’avons vu dans le chapitre 4 ces phonétogrammes sont partiels : ils ne repré¬ 
sentent pas la totalité de la tessiture des chanteurs. Le phonétogramme du mécanisme Ml des 
hommes ne décrit que le médium-aigu de leur tessiture dans ce mécanisme, et les phonéto¬ 
grammes du mécanisme M2 correspondent à la partie grave des possibilités vocales, pour les 
hommes comme pour les femmes, dans ce mécanisme. En revanche en mécanisme Ml, moins de 
30% des femmes ont réussi à produire les crescendos et decrescendos à des fréquences inférieures 
à celle du do2 et supérieure à celle du do4. En conséquence, les phonétogrammes moyennés des 
femmes en Ml représentent la totalité de leur tessiture dans ce mécanisme laryngé. 

Zone de recouvrement 

Un premier élément fondamental à remarquer est que la zone de recouvrement des mécanismes 
laryngés est considérable : elle est d’une octave et demie à deux octaves. Au moins 9 des 13 
hommes ont une tessiture qui monte jusqu’au sol#3 (415 Hz) en Ml sur deux des trois voyelles, 
et descend jusqu’au do2 (131 Hz) ou ré2 (147 Hz) en M2, soit une octave et demie de commun 
aux deux mécanismes. La tessiture moyenne des femmes s’étend du do2 (131 Hz) au sib3 (466 
Hz) ou au do4 (523 Hz) en Ml, et descend jusqu’au ré2 (147 Hz) ou au mi2 (165 Hz) en M2, soit 
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Hommes Femmes 



Fig. 5.1 - Phonétogrammes moyens des hommes et des femmes, sur les trois voyelles étudiées, 
et pour les mécanismes laryngés Ml et M2. 


/a/ loi Hl 



/a/ loi lil 



(a) Hommes 


(b) Femmes 


Fig. 5.2 - Phonétogrammes moyens et intervalles interquartiles pour les deux mécanismes et les 
trois voyelles. 
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une octave et une sixte de commun aux deux mécanismes. Outre les considérations de voyelles, 
l’étendue de la zone commune est proche de celle obtenue par Roubeau et al. (2004), pour 21 
hommes et 21 femmes, à savoir du ré#2 au fa#3 pour les hommes et du fa#2 au sol3 pour les 
femmes. La différence la plus notable porte sur la note la plus aigüe du mécanisme Ml chez les 
femmes, qui est une tierce plus haute dans notre étude que dans la leur. 

Fréquence et SPL sont corrélés 

Sur chacun des quatre diagrammes de la figure 5.1 nous constatons que le niveau SPL des 
limites inférieure et supérieure augmente avec la fréquence, ce qui traduit la corrélation entre 
SPL et fréquence, que l’on retrouve sur tous les phonétogrammes et qui est bien connue (Titze, 
1992; Sulter et al ., 1995; Henrich et al ., 2005; Pabon, 1991). Les ordres de grandeur (en dB) 
des limites sont aussi conformes aux études précédentes : sur la tessiture étudiée, les limites 
supérieures vont de 85 à 105 dB pour les hommes en Ml, de 70 à 100 dB pour les femmes 
en Ml, et de 70 à 100 dB pour les hommes comme pour les femmes en M2. Globalement, à 
fréquence donnée, les sons produits en mécanisme M2 sont donc moins forts que ceux produits 
en mécanisme Ml. 

Incidence des voyelles sur les phonétogrammes 

Le résultat le plus marquant de cette étude porte sur la différence d’influence de la voyelle 
selon le mécanisme. En mécanisme Ml: la limite supérieure des phonétogrammes sur /a/ est 
décalée de 10 dB vers les forts niveaux SPL par rapport à celle sur /i/. La limite sur le joj est 
proche de la limite du /a/ dans le grave (en dessous de ré3), et de celle sur /i/ dans l’aigu (au 
dessus de mi3). Ces tendances sont identiques chez les hommes et chez les femmes. Par contre, 
ces variations de la limite supérieure avec la voyelle sont totalement absentes en mécanisme 
M2, aussi bien chez les hommes que chez les femmes. Par ailleurs, les limites inférieures des 
phonétogrammes en Ml comme en M2 ne semblent pas varier avec la voyelle. 

Nous avons évalué la significativité statistique des tendances observées à l’aide d’un test 
ANOVA. La voyelle a une influence statistiquement significative sur la limite supérieure du pho- 
nétogramme de Ml, mais une influence non significative sur les autres limites (limite supérieure 
du M2 et limites inférieures en Ml et en M2), chez les hommes comme chez les femmes (pour 
les détails des analyses statistiques, voir annexe A, tableaux A.l à A.4, p. 159 à 161). 

Variabilité des limites 

Les figures 5.2(a) et 5.2(b) présentent les limites phonétographiques moyennes sur les trois 
voyelles et les deux mécanismes (comme sur la figure 5.1, mais dans une disposition différente) 
ainsi que les variabilités inter-sujets, pour chaque note de la tessiture. Globalement, les intervalles 
interquartiles sont de l’ordre de 5 dB sur les limites supérieures, indépendamment de la voyelle, 
du mécanisme et de la fréquence d’émission. En revanche, les variabilités sont plus importantes 
sur les limites inférieures, allant de 4 à 15 dB environ, avec des pointes à plus de 25 dB comme 
sur /a/ en Ml vers sol#3 (hommes comme femmes). En Ml, les limites inférieures sont plus 
variables sur /a/ que sur /i/ et que sur joj dans une moindre mesure. En M2, la voyelle 
ne semble pas avoir d’influence sur la variabilité des limites. Enfin, la variabilité des limites 
inférieures augmente avec la fréquence d’émission pour les hommes et pour les femmes (excepté 
pour les hommes en M2). 

Nous pouvons en conclure que l’influence de la voyelle sur la limite supérieure des phonéto¬ 
grammes n’est pas la même pour le mécanisme Ml que pour le mécanisme M2. 

5.1.2 Comparaison des phonétogrammes par mécanismes, pour les trois voyelles 
séparément 

La figure 5.1 est composée de quatre graphiques présentant, en Ml, en M2, pour les hommes 
et les femmes, l’influence de la voyelle sur les phonétogrammes. Sur la figure 5.3, nous observons 
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désormais, pour les hommes et les femmes, les phonétogrammes de Ml et M2 sur le même 
graphique, en prenant séparément les trois voyelles. Cette figure permet de visualiser directement 
les positions relatives des phonétogrammes de Ml et de M2. 


Hommes Femmes 




do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 


Fig. 5.3 - Phonétogrammes moyens des hommes et des femmes, sur les trois voyelles étudiées, 
et pour les mécanismes laryngés Ml et M2. Les données sont les mêmes que celles présentées 
figure 5.1, mais ici elles sont représentées pour les trois voyelles séparément. 

Pour les trois voyelles étudiées, les phonétogrammes de mécanisme M2 sont globalement 
translaté vers des niveaux plus bas que ceux de mécanisme Ml. Sur ces phonétogrammes moyens, 
et sur l’ensemble de la zone de recouvrement, la limite inférieure du mécanisme M2 est toujours 
à un niveau inférieur de celui de la limite inférieure du mécanisme Ml. En ce qui concerne la 
limite supérieure, sur la voyelle /a/ nous observons un décalage bien marqué entre la limite 
supérieure de mécanisme Ml et celle de M2 chez les hommes. Cette différence est un peu plus 
faible chez les femmes. Il est intéressant de constater que sur les voyelles j\j et /o/, les limites 
supérieures des phonétogrammes de mécanisme Ml et M2 se croisent, c’est-à-dire que dans 
l’aigu, les productions fortissimo de mécanisme M2 sont plus intenses que celles de Ml. 

Une étude complémentaire basée sur les enregistrements de 18 des 21 chanteurs (Lamesch 
et al. , 2008) a montré que la différence de limite supérieure entre les mécanismes Ml et M2 est 
statistiquement significative sur les deux octaves étudiées sur la voyelle /a/, mais l’est seulement 
jusqu’au mi3 sur /o/ et jusqu’au do3 sur /i/. Pour le chanteur, ce résultat a une conséquence 
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Hommes 


Femmes 



do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 


Fig. 5.4 - Dynamique moyenne des 21 chanteurs étudiés, sur les trois voyelles, et les deux méca¬ 
nismes. Les intervalles de confiance sont tracés en noir et les résultats des tests de significativité 
de rinfluence de la voyelle sont inscrits au dessus des graphiques (Détails des tests en annexe 
A, tableaux A.5 et A.6, p. 161 et 162). 


assez importante : la différence entre les mécanismes Ml et M2, en termes d’intensité SPL, est 
globalement plus importante sur la voyelle /a/ que sur la voyelle /o/, et à plus forte raison que 
sur la voyelle /i/. 


5.2 Données quantitatives sur la dynamique, sur l’aire phoné- 
tographique et sur les pentes phonétographiques 

5.2.1 Dynamique 

La dynamique vocale a été estimée, pour chaque chanteur, par la différence de niveau entre 
les limites supérieures et inférieures, pour chaque fréquence étudiée. La figure 5.4 présente la 
dynamique vocale moyenne obtenue pour les hommes (colonne de gauche) et les femmes (colonne 
de droite), dans les deux mécanismes laryngés, et sur les trois voyelles. Elle montre en particulier 
une diminution de la dynamique dans l’aigu du Ml (surtout chez les hommes) et dans le grave du 
M2, illustrant ainsi que la tessiture étudiée correspond à l’aigu du mécanisme Ml et au grave du 
mécanisme M2. La dynamique est de l’ordre de 25 à 30 dB, en Ml comme en M2, sur des notes 
que les chanteurs émettent aisément (à partir du do3 pour les femmes en M2, par exemple). 

Concernant l’effet de la voyelle, nous pouvons constater que la dynamique est toujours plus 
importante sur /a/ que sur /o/ et /i/, que ce soit en Ml ou en M2. En mécanisme Ml, cette 
différence est statistiquement significative de mi2 à ré3 pour les femmes, et de do2 à do3 pour 
les hommes. Les différences de dynamique dues aux voyelles sont plus faibles en M2 et sont 
globalement non significatives pour les hommes comme pour les femmes. Nous pouvons éta¬ 
blir un parallèle entre ces niveaux de significativité et les résultats présentés (partie 5.1) sur 
les limites des phonétogrammes : dans la partie précédente, nous avons vu que les limites des 
phonétogrammes variaient en fonction de la voyelle en Ml et pas en M2. Nous retrouvons cette 
incidence de la voyelle à travers l’étude de la dynamique. 
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5.2.2 Aires des phonétogrammes 

Le tableau 5.1 donne les valeurs d’aires mesurées, en dB*demi-ton, par sexe, par mécanisme 
et par voyelle. Les valeurs présentées sont difficilement interprétables en l’état, puisque les pho- 
nétogrammes ne sont que partiels. En revanche, les différences d’aires dues aux voyelles, ou au 
sexe, peuvent être discutées. Dans les deux mécanismes, les aires obtenues sont plus importantes 
sur /a/ que sur /i/ et /o/, mais cette différence n’est statistiquement significative que pour 
le mécanisme Ml. En moyenne, les phonétogrammes sur /i/ ne font que 67,9 % (écart type: 
11,1 %) des phonétogrammes de /a/ en Ml, et 82,3 % (écart type: 18,9 %) en M2 ; et les 
phonétogrammes de /o/ 85,3 % (écart type: 12,6 %) en Ml et 89,7 % (écart type: 13,1 %) en 
M2. 



Hommes 

Femmes 


Ml 

M2 

Ml 

M2 

/a/ 

553 (163) 

527 (113) 

512 (145) 

533 (177) 

N 

385 (HS) 

437 (96) 

329 (105) 

421 (168) 

/o/ 

486 (M2) 

470 (101) 

409 (116) 

474 (169) 


* 

ns 

* 

ns 


Tab. 5.1 - Moyennes (écarts types) des aires des phonétogrammes partiels en Ml et M2, sur les 
trois voyelles (en dB*demi-ton), et niveau de significativité de Vinfluence de la voyelle (Détails 
des tests en annexe A, tableau A. 7 p. 162). 


5.2.3 Pentes des phonétogrammes 

Les pentes des phonétogrammes et de leurs limites supérieures ont été estimées par méca¬ 
nisme laryngé, sur les trois voyelles séparément, pour les hommes et pour les femmes, par la 
méthode des moindres carrés. Les valeurs moyennes et écarts types obtenus sont présentés dans 
les tableaux 5.2 et 5.3. 

Les valeurs mesurées des pentes des phonétogrammes sont de l’ordre de 13 dB/Oct en Ml et 
de 14,5 dB en M2 (tableau 5.2). Ces valeurs sont assez similaires pour les hommes et les femmes, 
bien que le mécanisme ait une influence statistiquement peu significative pour les hommes, et 
pas significative pour les femmes. L’influence de la voyelle n’est significative ni pour les hommes, 
ni pour les femmes, que ce soit en mécanisme Ml ou en mécanisme M2. 

En revanche, les valeurs des pentes de la limite supérieure (tableau 5.3) varient fortement 
selon le mécanisme: elles sont de l’ordre de 9 dB/Oct pour les hommes et de 13 dB/Oct pour 
les femmes en Ml, et de 18 dB/Oct pour les hommes et les femmes en M2. Le mécanisme a une 
influence statistiquement très significative sur la pente de la limite supérieure chez les hommes 
et chez les femmes. En ce qui concerne les voyelles, les différences ne sont pas significatives. On 
peut néanmoins constater que les pentes de la limite supérieure des phonétogrammes de /o/, en 
Ml, sont légèrement plus faibles que celles de /i/ et de /a/ en Ml. Ce résultat est visible sur la 
limite supérieure des phonétogrammes moyens (cf. figure 5.1). 



Hommes 

Femmes 


Ml 

M2 

Ml 

M2 

/a/ 

N 

/o/ 

14.1 (3,7) 
13,0 (2,8) 

12.2 (4,1) 

15,0 (3,3) 

15,7 (3,9) 

14,3 (3,1) 

13,5 (4,7) 
13,7 (3,1) 
12,9 (2,7) 

13,6 (2,5) 

14,5 (3,9) 

14,3 (4,0) 

Moyenne 

13,1 (3,6) 

15,0 (3,4) * 

13,4 (3,5) 

14,2 (3,4) ns 


ns 

ns 

ns 

ns 


Tab. 5.2 - Pentes moyennes (écarts types) des phonétogrammes, en dB/Oct, par sexe, par 
mécanisme et par voyelle (Détails des tests en annexe A, tableaux A.8 et A.9 p. 163). 
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Hommes 

Femmes 


Ml 

M2 

Ml 

M2 

/a/ 

10,3 (2,5) 

18,2 (4,1) 

13,4 (4,3) 

16,9 (3,2) 

N 

9,9 (2,4) 

18,7 (2,7) 

14,1 (4,8) 

18,9 (2,4) 

/°/ 

8,0 (3,2) 

17,4 (2,6) 

12,2 (4,4) 

18,9 (3,0) 

Moyenne 

9,4 (2,8) 

18,1 (3,2) *** 

13,2 (4,4) 

18,2 (2,9) *** 


ns 

ns 

ns 

ns 


Tab. 5.3 - Pentes moyennes (écarts types) de la limite supérieure des phonétogrammes, en 
dB/Oct, par sexe, par mécanisme et par voyelle (Détails des tests en annexe A, tableaux A. 10 
et A.11 p. 163). 


Les deux estimations de pente donnent des valeurs très différentes. Utiliser l’une plutôt que 
l’autre n’est donc pas un choix anodin. Leur intérêt n’est pas équivalent, ni leur fiabilité. Comme 
nous l’avons vu, la limite inférieure est plus variable que la limite supérieure, en conséquence la 
pente moyenne des phonétogrammes est également plus variable (et vraisemblablement moins 
stable) que la pente de la limite supérieure seule. 


5.3 Discussion 

Dans cette partie, les principaux résultats de cette étude sont discutés et mis en rapport 
avec ceux de la littérature. Comme nous allons le voir, ce dernier point s’avère particulièrement 
délicat en raison de la grande diversité des méthodes d’étude, et plus particulièrement du fait 
que la plupart des études ne prennent pas en compte la distinction des mécanismes laryngés. 
Ne disposant pas des informations permettant d’attester du mécanisme utilisé, nous serons dans 
l’obligation de faire des hypothèses sur le mécanisme utilisé. 

5.3.1 Influence de la voyelle 

Le résultat majeur du présent travail est le fait que l’influence de la voyelle sur les contours 
des phonétogrammes est différente selon le mécanisme de production laryngée. En Ml, la limite 
supérieure du phonétogramme de la voyelle /a/ est supérieure de 10 dB par rapport à /i/, alors 
que la limite inférieure n’est globalement pas modifiée. Ces deux phénomènes impliquent une 
augmentation statistiquement significative de la dynamique pour les hommes et les femmes et 
une augmentation de l’aire des phonétogrammes, ce qui signifie que la variabilité due à la voyelle 
est très supérieure à la variabilité inter-sujets. Le plus inattendu est que nous n’observions pas 
d’influence de la voyelle en mécanisme M2, ni sur les limites des phonétogrammes, ni sur la 
dynamique, ni sur les aires. 

Nous constatons que notre étude permet d’interpréter en termes de mécanismes laryngés la 
diversité des résultats quant à l’influence de la voyelle sur les limites phonétographiques, que 
nous avons relevée dans la partie 3.4.2. La différence de 10 dB que nous relevons en mécanisme 
Ml sur les limites supérieures est en accord avec les résultats observés chez les hommes et chez 
les femmes dans le grave de leur tessiture. Le fait que les femmes chantent en mécanisme M2 
dans les parties medium et aigües de leur tessiture s’accorde avec l’absence d’influence de la 
voyelle observée sur les phonétogrammes de M2. 

Les différences d’influence de la voyelle sur les limites phonétographiques relevées entre les 
hommes et les femmes semblent donc plus liées à des différences d’utilisation des mécanismes 
laryngés qu’à la différence de sexe. 

Développement acoustique 

Tentons, dans le cadre de la théorie source-filtre linéaire, de comprendre ces résultats. 

Les variations de SPL en fonction des voyelles sont habituellement expliquées par deux 
facteurs, se ramenant essentiellement à la fréquence du premier formant (Fl) : si la fréquence 
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du premier formant (Fl) augmente, le niveau de l’énergie située en hautes fréquences augmente, 
et donc le SPL augmente à son tour (Fant et al ., 1963). Par ailleurs, quand Fl est proche 
d’un harmonique, l’énergie de cet harmonique augmente (phénomène de formant tuning), ce qui 
implique également une augmentation de SPL (Gramming et Sundberg, 1988; Fant et al ., 1963; 
Sundberg et al., 1993). Sur /a/ le Fl est plus élevé que sur /i/ et /o/, nous pouvons donc nous 
attendre à mesurer des niveaux SPL supérieurs sur /a/ à ceux des autres voyelles étudiées, ce 
qui est cohérent avec nos résultats obtenus en mécanisme Ml. 

Pour expliquer nos résultats obtenus en mécanisme M2, il semble nécessaire de prendre en 
compte les différences à la source entre le mécanisme Ml et M2. Nous verrons dans la partie 6.4 
dans quelle mesure des différences à la source permettent d’expliquer les différences de limites 
supérieures observées. 

Au niveau de la limite inférieure, le niveau sonore est très faible et le spectre très pauvre. 
Concrètement, cela signifie que la quasi-totalité de l’énergie se trouve dans le premier harmonique 
(Gramming, 1991). Au niveau du filtre résonantiel, nous en déduisons que l’influence de la voyelle 
sur l’intensité totale ne dépend que de l’éloignement de la fréquence du premier formant avec la 
fréquence fondamentale. Pour un signal de source donné, sur la voyelle /i/ le premier formant est 
proche de la fréquence fondamentale sur le /i/, alors qu’il est éloigné sur le /a/. En conséquence 
le niveau minimal devrait être plus grand sur /i/ que sur /a/. Or nous n’observons pas cette 
tendance. 

Notre étude montre que la voyelle n’est pas un paramètre de premier ordre faisant varier 
la limite inférieure des phonétogrammes. La variabilité inter-sujet est plus grande. Une étude 
complémentaire pourrait consister à étudier la variabilité intra-sujet par rapport à la variabilité 
due à la voyelle sur la limite inférieure. Nous rediscuterons des questions de variabilité dans la 
partie 5.3.4. 

5.3.2 Étude en fonction du genre 

L’influence des voyelles est proche pour les hommes et pour les femmes si l’on étudie, pour 
chacun, les mécanismes séparément. Deux points méritent d’être discutés, en lien avec la tessiture 
étudiée et avec l’entraînement vocal. 

Phonétogrammes globaux / tessiture 

Par rapport aux phonétogrammes des hommes, ceux des femmes sont globalement décalés 
de 10 dB vers le bas (cf. figure 5.1). Ce résultat, déjà montré par Roubeau et al. (2004), ne vaut 
que pour la tessiture commune aux deux sexes, celle qui correspond à l’aigu des hommes, et au 
grave des femmes. Sulter et al. (1995) ont effectué des phonétogrammes complets d’hommes et 
de femmes, qu’ils ont également normalisés en fréquence (rescaling method ). Compte tenu d’une 
pente moyenne de 14 dB/oct (cf. partie 5.2.3), l’écart moyen de 10 dB entre les phonétogrammes 
des hommes et ceux des femmes correspond à un décalage moyen de la tessiture de 8 demi-tons 
environ, ce qui est conforme aux résultats moyens obtenus sur des phonétogrammes complets. 

Aires / entraînement vocal 

L’aire des phonétogrammes de mécanisme M2 est plus importante chez les femmes que chez 
les hommes, et inversement pour ceux de Ml. Il en est de même pour la dynamique. Cette 
remarque a déjà été relevée par Roubeau et al. (2004), qui avaient proposé une justification 
en termes d’entraînement vocal. Tous les chanteurs enregistrés sont des chanteurs confirmés 
ou professionnels, mais les pratiques vocales varient beaucoup en fonction de la tessiture des 
chanteurs. La plupart des hommes (à l’exception des contre-ténors) n’utilisent que le mécanisme 
Ml, alors que certaines femmes utilisent les deux en privilégiant le M2, et que certaines sopranos 
n’utilisent probablement que le M2. L’entraînement vocal amène donc, dans bien des cas, à 
favoriser l’emploi d’un mécanisme par rapport à l’autre, à savoir le mécanisme Ml pour les 
hommes et le mécanisme M2 pour les femmes. Sans aller jusqu’à considérer que le travail d’un 
mécanisme n’a aucune influence sur l’autre, on peut quand même supposer que le Ml est moins 
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entraîné que le M2 pour les femmes, et que le M2 l’est moins pour les hommes. Les différences 
d’aires mesurées seraient alors simplement dues à des différences d’entraînement vocal. 

5.3.3 Influence des mécanismes sur... 
les phonétogrammes 

La plupart des auteurs repèrent les transitions d’un type d’émission vocale à un autre (qu’il 
s’agisse de mécanismes laryngés ou de registres) sur les phonétogrammes par une inflexion de la 
limite supérieure (Sulter et al., 1994; Klingholz et Martin, 1983; Schutte, 1980; Calvet et Malhiac, 
1952). Roubeau et al. (2004) ont montré que cette inflexion est due au décalage vers les bas 
niveaux SPL du phonétogramme de M2 par rapport à celui de Ml quand les phonétogrammes 
sont enregistrés sur la voyelle /a/. Nous avons vu dans la section 5.1.2 que ce résultat n’est valable 
que sur la voyelle /a/. En conséquence cette méthode d’explication a posteriori des inflexions 
de la limite supérieure nous semble peu souhaitable pour identifier le mécanisme laryngé utilisé 
lors de l’enregistrement. Il est vraisemblable qu’il en soit de même à propos du registre dans la 
mesure où, comme pour les mécanismes, il peut exister des zones de recouvrement dans le plan 
phonétographique. Un critère de substitution pour identifier le mécanisme utilisé peut alors être 
la pente de la limite supérieure, mais l’idéal reste d’identifier le mécanisme (ou le registre vocal) 
lors de l’enregistrement ou, production par production, à partir de l’étude de différents signaux 
(sonores et électroglottographiques par exemple). 

les pentes des phonétogrammes 

Les pentes estimées n’ont pas montré de dépendance à la voyelle, mais varient en fonction 
du mécanisme, surtout la pente de la limite supérieure des phonétogrammes. Ces pentes sug¬ 
gèrent que la corrélation entre la fréquence d’émission et le SPL n’est pas la même en fonction 
du mécanisme laryngé utilisé. Les valeurs des pentes des phonétogrammes sont globalement co¬ 
hérentes avec celles présentées dans la littérature. Sulter et al. (1995) ont étudié la pente de 
phonétogrammes moyens de femmes et d’hommes entraînés et non entraînés. Pour des sujets 
entraînés, ils obtiennent 11.3 dB/oct pour les hommes et 11.9 dB/oct pour les femmes, valeurs 
qui sont légèrement plus faibles que les nôtres. Ces différences peuvent être attribuées au fait 
que notre étude porte sur des phonétogrammes partiels et par mécanisme laryngé. 

Klingholz et Martin (1983) ont établi des phonétogrammes moyens d’hommes et de femmes 
entraînés, et ont déterminé des registres (appelés «Brustregister» et «Kopfregister», c’est-à-dire 
registre de poitrine et de tête) en faisant correspondre une ellipse par registre. Ils estiment 
ensuite la pente des phonétogrammes par mécanisme comme étant la pente du grand axe de 
l’ellipse. Leurs valeurs sont éloignées de nos mesures, car d’une part, la méthode d’estimation 
de la pente est très différente, d’autre part, les auteurs identifient les registres a posteriori, et 
ne peuvent donc pas prendre en compte la zone de recouvrement qui est précisément l’objet de 
notre étude. De plus la correspondance entre leur terminologie et celle que nous avons utilisée 
n’est pas assurée. 

5.3.4 Variabilité des limites phonétographiques 

Un point particulièrement sensible est la représentativité des mesures présentées ici. Plusieurs 
travaux (Sihvo et Sala, 1996; Gramming, 1991; Gramming et al., 1991; Stone et Krause Ferch, 
1982) ont porté sur la variabilité intra-chanteurs, qui est donc estimée à 3 dB environ au niveau 
des limites supérieure et inférieure. 

Par comparaison, les variations inter-chanteur mesurées ici sont de l’ordre de 5 dB sur les 
limites supérieures. Ces valeurs sont proches de celles proposées dans la littérature (Sulter et al., 
1995; Akerlund et al., 1992). Une variabilité plus importante a été constatée au niveau des limites 
inférieures. Cette variabilité peut être expliquée par celle du niveau des chanteurs recrutés, 
à savoir des chanteurs de niveau avancé ou professionnel. En effet, différentes études (Sulter 
et al., 1995; Awan, 1991; LeBorgne et Weinrich, 2002) ont montré que l’entraînement vocal 
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avait pour effet d’abaisser la limite phonétographique inférieure. Ce point peut être expliqué 
par une recherche fine de contrôle de la pression sous-glottique, particulièrement délicat dans 
les phonations à faible SPL. 

Nous avons également constaté que la variabilité augmente avec la fréquence d’émission en 
Ml, ce que l’on peut attribuer en partie à des différences physiologiques mais également à la 
pratique différenciée des tessitures selon les chanteurs hommes. Nous pouvons en effet faire 
l’hypothèse que les différences de limites deviennent de plus en plus grandes entre des ténors 
et des basses quand la fréquence augmente, ce qui explique que la variabilité croisse. Chez les 
femmes, la variabilité peut être expliquée par une habileté plus ou moins développée à maîtriser 
le mécanisme Ml dans les productions piano et aigües. Ce type de productions ne leur est pas 
indispensable dans la mesure où elles peuvent les produire en mécanisme M2, avec une qualité 
vocale très similaire (registre de voix mixte, cf. section 1.2.3). Nous illustrons ces variabilités par 
les phonétogrammes présentés figure 5.5 : sur le phonétogramme de gauche, en mécanisme Ml, 
nous voyons que la limite inférieure augmente de 20 dB environ en passant du ré3 au mi3. Cela 
signifie que S2 n’a plus réussi, en montant vers les notes aigües, à maintenir son mécanisme Ml. 
MS2 (qui est chanteuse de gospel) ne présente pas cette variation brutale de niveau de limite 
inférieure. Les deux chanteuses présentent deux approches différentes de leur voix, impliquant 
cette variabilité très importante sur la limite inférieure du mécanisme Ml. 



Fig. 5.5 - Phonétogrammes par mécanisme laryngé de MS2 (gauche) et S2 (droite). Voyelle : 
/a/. 


L’entraînement vocal variable des sujets féminins enregistrés peut également expliquer la 
variabilité constatée sur la limite inférieure de M2. L’étude menée sur le non-accolement des 
cordes vocales (partie 5.4) apportera d’autres éléments pour comprendre ces variabilités. Néan¬ 
moins une étude de chanteurs très expérimentés et distinguant finement les différentes tessitures, 
montrerait très certainement des variabilités plus faibles. 

5.4 Limites inférieures : prendre en compte le non-accolement 
des cordes vocales 

Lors de productions pianissimo (notamment en fin de decrescendo dans notre base de don¬ 
nées), il arrive que l’amplitude du signal EGG devienne extrêmement faible et que les pics 
d’ouverture et de fermeture glottique n’apparaissent plus sur le signal DEGG. 

La figure 5.6 présente un decrescendo produit par une chanteuse en mécanisme M2. Nous 
constatons sur la courbe représentant ce signal EGG une diminution très importante de l’am¬ 
plitude du signal EGG entre 1 et 2 s, ce signal demeurant ensuite extrêmement faible de 2.5 s 
à la fin de la production. Cette diminution soudaine de l’amplitude de l’EGG est accompagnée 
au niveau du signal sonore par une diminution de l’amplitude des harmoniques dont la fré¬ 
quence excède 1500 Hz. Néanmoins, nous constatons que cette chanteuse, quasi professionnelle, 
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maitrise parfaitement l’intensité sonore puisque le niveau mesuré diminue de façon progressive, 
conformément à la consigne. 


CL 

LO 

Cû 

"O 
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I 

O 


CD 





Fig. 5.6 - Exemple de production (un decrescendo) présentant une diminution soudaine de 
Vamplitude du signal EGG. Chanteur: S3, sol#3, voyelle: /o/, mécanisme M2. Les signaux 
EGG et DEGG ont été tracés à deux instants différents, ils permettent de visualiser leur forme 
d’onde. Sur ces deux figures, leur amplitude n’est pas comparable (exemple sonore 4). 


Sur la figure 5.6, nous avons représenté le signal EGG et sa dérivée, à un instant où l’am¬ 
plitude de l’EGG est importante et à un autre instant où elle est très faible. Dans le premier 
cas, le signal EGG présente l’allure habituelle d’une onde produite en mécanisme M2 (Roubeau 
et al. , 2009), et le signal DEGG présente les pics d’ouverture et de fermeture habituels (avec 
un dédoublement de pic de fermeture). Dans le cas de l’amplitude faible du signal EGG, l’onde 
présente un aspect très sinusoïdal, et sa dérivée ne présente plus les pics d’ouverture et de fer¬ 
meture. Nous en déduisons qu’au cours de cette production, la chanteuse passe d’une situation 
où les cordes vocales s’accolent à une situation où le contact glottique disparait (ou n’est plus 
détecté). 

La zone phonétographique correspondant à cette absence de détection d’accolement a peu 
été étudiée dans la littérature. Mentionnons tout de même Sulter et al. (1994) qui ont remarqué 
en comparant leur étude phonétographique à celle de Awan (1991) qu’il pouvait y avoir une 
différence constante et très importante (plus de 15 dB) sur la limite inférieure d’une étude 
à l’autre. Dans de nombreux cas une telle différence peut être attribuée à l’utilisation de la 
pondération A (le dB-A) pour tracer les phonétogrammes (voir section 3.1.2), mais dans ce 
cas-ci l’auteur suggère que cela serait dû à l’enregistrement ou non de sons correspondant à une 
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qualité particulièrement soufflée. Pabon et collaborateurs (Pabon, 1991; Bloothooft et Pabon, 
1999) mentionnent également l’existence d’une zone dans le bas du phonétogramme (donc à très 
faible intensité) où le signal sonore est quasi-sinusoïdal. Vilkmann et collaborateurs (Vilkman 
et al ., 1995; Vilkman et Alku, 1993) ont étudié les transitions de registres entre modal et falsetto 
à faible intensité et dans le grave de la tessiture. Ils ont associé au terme de falsetto un type de 
production sans accolement des cordes vocales. 

Nous avons cherché à détecter quelles étaient les zones phonétographiques correspondant à 
une absence de détection d’accolement. Nous avons donc calculé comme précédemment ce que 
seraient les limites moyennes des phonétogrammes de nos 21 chanteurs en ne considérant que les 
zones phonétographiques correspondant à un accolement détecté par l’électroglottographe. Pour 
cela, pour chaque chanteur, un seuil d’accolement a été estimé à partir des signaux EGG de la 
base de données correspondant aux parties des productions vocales utilisées effectivement pour 
tracer les phonétogrammes. Les productions dont l’amplitude de l’EGG est inférieure à ce seuil 
sont considérées comme ayant été produites sans accolement des cordes vocales. Le résultat est 
donné figure 5.7. (La méthode d’estimation de l’amplitude du signal EGG sera précisée section 
6 . 1 ). 

Sur cette figure, les zones situées entre les pointillés et la limite basse du phonétogramme 
correspondent à des sons que le chanteur émet sans accolement des cordes vocales (détecté 
par l’électroglottographe). La zone située entre la limite pointillée et la limite supérieure du 
phonétogramme correspond aux productions émises avec accolement détecté (et qui correspond 
donc au fonctionnement vocal rencontré dans le cas général en chant et parole). Nous constatons 
sur cette figure que cette zone sans accolement (détecté) des cordes vocales est très importante 
en mécanisme M2 et très petite en Ml. Cela signifie que lors des decrescendi, les chanteurs ont 
peu utilisé ce type de phonation sans accolement venant du mécanisme Ml, mais ils l’ont utilisé 
plus largement en venant du M2. Concrètement, une étude supplémentaire serait nécessaire pour 
expliciter dans quelle mesure il est possible d’émettre un son avec une vibration glottique de 
type Ml ou M2, sans accolement glottique, en observant directement la participation ou non du 
muscle vocal à la vibration laryngée. Soulignons que Vilkman et al. (1995) ont associé ce type 
de phonation sans accolement glottique au registre de falsetto. 

Nous pouvons constater qu’en moyenne, les femmes ont une zone sans accolement plus éten¬ 
due que les hommes. Le tableau 5.4 présente un détail de la différence d’intensité entre les limites 
inférieures des phonétogrammes et les limites de détection d’accolement glottique. En mécanisme 
M2, toutes voyelles confondues, la différence entre limites inférieures et limites de détection d’ac¬ 
colement est toujours supérieure à 8 dB pour les sopranos alors qu’elle ne dépassent pas les 5 
dB chez les mezzo-sopranos. Cette différence peut être reliée à des différences de physiologie de 
larynx, ou/et à des différences en terme d’utilisation de leur voix. En effet, les sopranos chantant 
aigu, elles sont naturellement amenées à chanter fort. Pour trouver des nuances plus piano, elles 
sont amenées à travailler particulièrement le bas de leur phonétogramme, et donc peut-être à 
travailler cette zone sans accolement détecté. Vu l’étendue de cette zone chez certaines d’entre 
elles, il est fortement probable qu’elles soient amenées à utiliser ce type de production lors de 
représentations. 

Parmi les mezzo-sopranos, nous constatons que deux d’entre elles n’ont pratiquement pas 
utilisé cette phonation sans accolement (détecté) en M2 alors que les deux autres l’ont utilisé. 
Nous touchons vraisemblablement ici à une autre limite par rapport à la pertinence de la limite 
inférieure : en dépit des indications, certains chanteurs ont considéré que cette zone ne corres¬ 
pondait pas à des productions acceptables, alors que d’autres auront adopté implicitement la 
position inverse. 

D’ailleurs, si nous revenons maintenant à la figure 5.7, nous pouvons relever un deuxième 
fait intéressant : chez les femmes notamment, les écarts types calculés sont plus faibles sur les 
limites d’accolement que sur les limites inférieures de phonétogramme. La limite d’accolement 
est donc moins variable aux différences inter-sujets. Ceci peut être lié au résultat mis en évidence 
dans le paragraphe précédent : parmi les quatre mezzo-sopranos, deux seulement ont une limite 
phonétographique inférieure distincte de celle de détection d’accolement glottique. Cela peut 
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Hommes 


Femmes 



do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 



Fig. 5.7 - Phonétogrammes moyens (et écarts types) par mécanismes laryngés, présentés sépa¬ 
rément pour les hommes et les femmes (colonnes), et pour chaque voyelle (lignes). Les limites 
de détection d’accolement figurent en traits fin et pointillés. 
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Ml 

M2 


/a/ 

N 

/o/ 

/a/ 
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1 

2 
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9 
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S3 
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MS3 

0 

0 

2 
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1 

5 
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2 

1 

1 

Tl 
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1 
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1 

2 

7 

9 
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3 

1 

2 

3 

2 

3 

T4 

4 
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3 

6 
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2 
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1 

0 

3 

1 

1 
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0 

0 

0 

3 

5 

2 
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5 

4 
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8 

B1 

0 
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0 

3 
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1 

0 

1 

6 

3 

B3 

5 

4 

5 
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Tab. 5.4 - Différence moyenne (en dB) entre les limites inférieures des phonétogrammes et les 
limites de détection d’accolement glottique, pour chaque chanteur, sur chaque mécanisme laryngé 
et chaque voyelle. 
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contribuer à augmenter la variabilité des limites inférieures des phonétogrammes. 

Il y aurait encore beaucoup à dire sur les particularités de chaque chanteur par rapport à cette 
zone d’accolement, nous y reviendrons dans la partie 6.1. Pour conclure, soulignons simplement 
que la prise en compte de cette limite d’accolement glottique permettra certainement à l’avenir 
de mettre en place des normalisations respectant mieux la diversité des chanteurs. 


5.5 La zone de recouvrement: aire et voyelle 

La zone de recouvrement est une région stratégique pour les chanteurs, ne serait-ce que 
parce que cette zone abrite au moins un «passage». Elle est, dans la plupart des cas, délimitée 
en fréquence par la limite grave du mécanisme M2 et la limite aigüe du mécanisme Ml, et en 
intensité par la limite supérieure du mécanisme M2 et la limite inférieure du mécanisme Ml. 
Nous allons dans cette partie étudier son aire ainsi que l’influence de la voyelle. 

600 
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f 400 
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£ 200 
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Fig. 5.8 - Aire de recouvrement des phonétogrammes de mécanismes Ml et M2, en dB*demi-ton, 
pour chaque voyelle et chaque chanteur. 

Nous présentons sur la figure 5.8 les aires de recouvrement des phonétogrammes en mé¬ 
canismes Ml et M2 de chaque chanteur, pour chaque voyelle. Nous pouvons constater sur ce 
graphique que l’aire de recouvrement dépend largement du chanteur. Parmi les femmes, S3, 
MSI et MS3 ont des aires de recouvrement plutôt faibles, alors que S2, S4, MS2 ont des aires de 
recouvrement beaucoup plus grandes. Parmi les chanteurs masculins, les ténors ont en moyenne 
une aire de recouvrement plus importante que les barytons et que les basses. 

Nous pouvons avancer que ces constatations sont liées à l’usage des mécanismes laryngés. 
Les ténors, qui repoussent la limite aigüe du Ml, développent de fait la zone de recouvrement, 
ce qui n’est pas le cas (ou dans une moindre mesure) des barytons et des basses. Pour les voix 
de femmes, une zone de recouvrement très réduite est liée à une technique ciblant le changement 
de mécanisme autour de deux ou trois notes. 

Sur l’ensemble des aires de recouvrement étudiées, la voyelle est responsable de 2.1 % de 
la variance totale, le reste étant imputable à la variabilité inter-individuelle, qui est donc la 
première cause de variabilité de la surface de la zone de recouvrement. La faible influence de la 
voyelle est à mettre en relation avec le fait que la zone de recouvrement est délimitée, dans la 
plupart des cas, par la limite inférieure du mécanisme Ml qui dépend fortement du chanteur, 
et la limite supérieure du mécanisme M2, qui dépend peu de la voyelle (comme nous l’avons vu 
dans la partie 5.1). 



5.6 Identification et variabilité des voyelles 

Suite à l’enregistrement des phonétogrammes par mécanisme et par voyelle, nous avons 
mentionné dans la partie 4.4.2 que l’identification du mécanisme laryngé a fait l’objet d’une 
validation minutieuse. Il semble alors pertinent d’adopter une même démarche de validation par 
rapport à la voyelle. 
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Nous pouvons croire a priori que l’identification d’une voyelle est chose aisée. En réalité la 
tâche peut s’avérer bien compliquée. D’abord, il faut identifier l’objet visé: qu’est-ce qu’une 
voyelle? Peut-on la décrire exclusivement par les fréquences des deux (ou trois) premiers for¬ 
mants? S’agit-il d’une notion à définir de façon perceptive, donc du point de vue acoustique et 
dans un contexte donné, en prenant en compte le timbre vocal (extra-vocalique), la hauteur, ...? 

Si l’on considère la voyelle de par les fréquences formantiques, valider la voyelle visée néces¬ 
site d’estimer les fréquences des deux premiers formants sur le signal sonore, ou d’utiliser des 
techniques de mesure des résonances du conduit vocal (voir partie 1.3.2) lors de l’enregistrement. 
Une fois ces données obtenues, il est nécessaire de les comparer à un modèle plus ou moins fin 
(donc plus ou moins complexe à définir) pour classifier chaque production comme étant un /a/, 
un /i/, un /o/ ou autre chose. Dans une étude sur la voix chantée lyrique, nous savons que les 
fréquences formantiques du modèle doivent être adaptées à la fréquence fondamentale du son 
(pour tenir compte du «formant tuning», cf. partie 1.4.2). La fréquence fondamentale du son, 
comme le sexe des chanteurs ou leur âge, est un paramètre à prendre en compte. Si la voyelle 
est envisagée à partir du champ de la perception sonore, elle est alors un objet que chacun est 
libre de définir selon ses propres représentations. 

Effectuer un test d’écoute à propos des voyelles serait vraisemblablement très riche en infor¬ 
mations. En effet il est possible que certaines voyelles aient «migré» au cours de l’enregistrement, 
comme par exemple des /a/ qui se soient fermés ou des /o/ qui se soient ouverts. De plus il 
serait également normal d’observer du «formant tuning» sur les trois voyelles (particulièrement 
sur le /i/ dont le premier formant est très bas). Nous n’avons pas organisé de test d’écoute par 
manque de temps : il y a en effet plus de 3500 productions (de mécanisme Ml ou M2) à tester. 

En se focalisant sur les mesures de fréquences formantiques, nous présentons dans cette 
partie les résultats des estimations formantiques effectuées sur les productions de MO (nous 
avons utilisé la méthode de prédiction linéaire par autocorrélation, cf. Makhoul, 1975). Les 
chanteurs avaient pour consigne de garder la forme du conduit vocal identique lors du crescendo 
ou decrescendo et de la production en MO qui suivait. Si cette tâche a été respectée, les fréquences 
formantiques doivent donc correspondre à celles du crescendo/decrescendo, et ainsi nous fournir 
des renseignements précieux sur la conformation du conduit vocal sur les limites supérieures et 
inférieures des phonétogrammes. Le détail des résultats nous conduira à discuter l’efficacité de 
la méthode. 

5.6.1 Fréquences formantiques moyennes mesurées en MO 

La figure 5.9 présente les moyennes et intervalles interquartiles des fréquences des deux 
premiers formants, mesurées sur les productions de MO. Nous voyons par exemple sur les deux 
graphiques du haut que sur la voyelle /a/, le premier formant est localisé à 600-650 Hz environ 
pour les hommes et 700-750 Hz pour les femmes, et le deuxième formant à 1100 Hz pour les 
hommes, et 1250 Hz pour les femmes. 


Discrimination des voyelles 

La première constatation que nous pouvons faire à la vue de cette figure est que nous pouvons 
aisément distinguer les trois voyelles. Les fréquences formantiques prennent bien des valeurs 
différentes en fonction de la voyelle. Les chanteurs ont donc globalement respecté la consigne 
(au moins sur les productions de MO...). La figure 5.10 présente, dans le plan F1-F2, les positions 
des productions mesurées (pour les hommes et les femmes séparément). Nous constatons que 
les points correspondant à la voyelle /i/ sont très bien isolés, mais ceux correspondant au /o/ 
et ceux au /a/ sont proches. Sur cette dernière figure, nous avons également fait figurer, pour 
les hommes et les femmes, les valeurs médianes tabulées dans Calliope (1989). Par rapport à 
ces valeurs, nous constatons que les chanteurs ont produit des sons allant du [o] fermé au [o] 
ouvert quand nous leur demandions un /o/, et se permettaient également de modifier leur /a/ 
jusqu’à atteindre le même [o] ouvert. Nous voyons également que l’ensemble des /i/ produits est 
beaucoup plus vaste que la région décrite dans Calliope. 
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Fig. 5.9 - Moyennes, intervalles interquartiles des fréquences des deux premiers formants en 
fonction de la hauteur, présentés séparément pour les trois voyelles, les hommes et les femmes. 
Les harmoniques sont également tracées, en traits fin. Les résultats concernant le mécanisme Ml 
sont tracés en bleu, ceux du M2 en rouge. 
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Nous pouvons déduire de ces observations que lors de certains enregistrements, certains joj 
se sont «ouverts» (ce qui se manifeste sur le graphique par une augmentation du Fl) et que 
certains /a/ se sont fermés. 



Fl [Hz] Fl [Hz] 

(a) Hommes (b) Femmes 

Fig. 5.10 - Positions des productions des chanteurs hommes (a) et femmes (b) dans le plan Fl- 
F2, pour les trois voyelles, et le mécanisme Ml. Nous y avons superposé un triangle vocalique 
théorique, obtenu à partir des valeurs médianes et des écarts types donnés par Calliope (1989). 
Ces valeurs théoriques ont été obtenues à partir de la parole. 


Fréquences formantiques et mécanismes laryngés 

Globalement, les fréquences formantiques estimées en Ml et en M2 sont très proches. Nous 
constatons néanmoins sur le joj ou sur le /a/ que les formants ont tendance à être plus élevés 
en mécanisme Ml qu’en M2, en particulier le deuxième formant de fa#3 à do4 sur le /a/ pour 
les femmes, et le premier formant de ré2 à sib2 sur le joj pour les hommes. Ces résultats sont en 
accord avec les observations de Henrich et al. (2008), effectuées avec l’appareillage de mesures 
de résonances du conduit vocal. Sur la voyelle /i/, aucune tendance ne se dégage, ni pour les 
hommes, ni pour les femmes. 

Formants et fréquence fondamentale 

Un résultat surprenant est que les fréquences formantiques mesurées sont très peu affectées 
par la fréquence fondamentale. Même sur la voyelle /i/, la fréquence du premier formant reste à 
peu près constante, et à partir du ré3 (pour les hommes) ou du fa#3 (pour les femmes), passe en 
dessous de la fréquence fondamentale, ce qui constitue une situation défavorable (Titze, 2008; 
Titze et al., 2008). Ce constat cache en fait une plus grande variété dans les résultats observés 
sur la totalité de la base de données. La figure 5.11 présente les fréquences des quatre premiers 
formants pour Bar4 en mécanisme M2, sur /i/. Cette figure montre bien que le chanteur a adapté 
sa voyelle en fonction de la hauteur, puisque les formants 2 et 3 descendent à partir de fa#3, 
alors que le premier formant augmente pour rester au niveau de la fréquence fondamentale. 
Nous en déduisons que la plupart des chanteurs ne manifestent pas de «formant tuning» sur 
les estimations de fréquences formantiques effectuées sur les productions de MO, mais nous en 
avons néanmoins relevé dans quelques cas comme celui présenté ici. 

5.6.2 Limites de la méthode d’estimation des fréquences formantiques 

Les constatations mentionnées à propos du «formant tuning» nous permettent de discuter 
la pertinence de la méthode utilisée. Le «formant tuning» permet d’ajuster les fréquences for¬ 
mantiques légèrement au-dessus de la fréquence de l’harmonique la plus proche. Dans notre 
expérience, nous avons mesuré les fréquences formantiques sur des productions de MO à fré¬ 
quence très basse. Si nous avions obtenu des estimations de fréquences formantiques ajustées à 
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Fig. 5.11 - Fréquences formantiques des quatre premiers formants, en fonction de la hauteur, 
pour Barf, en mécanisme M2, sur /i/ et sur sa limite phonétographique inférieure. Les harmo¬ 
niques sont tracées en couleur pâle. 


la fréquence du crescendo ou descrescendo qui précède lors de renregistrement, cela aurait pu 
constituer une preuve comme quoi le chanteur a bien gardé la position de la bouche convenable 
et aurait ainsi pu valider la représentativité des mesures. Or nous avons vu que ce n’était globale¬ 
ment pas le cas. Néanmoins les fréquences estimées sont cohérentes par rapport à la voyelle visée. 
La méthode utilisée fournit donc une estimation des fréquences formantiques qui est vague et qui 
ne nous permet pas de mettre en évidence des adaptations fines que le chanteur a pu effectuer. 

De plus, compte tenu des grandes variations en terme d’activité musculaire laryngée entre le 
mécanisme MO et l’aigu du mécanisme Ml ou le mécanisme M2, il est probable que la hauteur 
du larynx ait pu varier chez certains chanteurs entre le crescendo ou decrescendo et le MO, ce qui 
modifie les fréquences formantiques. Pour illustrer notre propos, nous avons représenté figure 5.12 
les spectrogrammes, amplitudes EGG et VLPs de deux crescendi auxquels nous avons associé les 
productions en MO à partir desquelles nous avons effectué nos estimations formantiques. Nous 
observons, dans le premier cas, que le larynx a été maintenu dans la même position sur la fin 
du crescendo et sur la production de MO (bien qu’il soit assez instable en MO), ce qui n’est 
pas le cas sur la production présentée en figure 5.12(b). Néanmoins le spectrogramme n’est pas 
un outil nous permettant de quantifier l’influence de la position du larynx sur les fréquences 
formantiques. 

Nous conclurons donc cette partie en soulignant que ces mesures de fréquences formantiques 
ne nous permettent pas de valider l’ensemble de la base de données en termes de voyelles. 

5.7 Bilan du chapitre 

Nous avons présenté des phonétogrammes par mécanisme laryngé et par voyelle. 


1. Influence de la voyelle sur les limites supérieures: 

Dans la tessiture étudiée, la limite supérieure des phonétogramme de Ml est d’environ 
10 dB supérieur sur /a/ que sur /i/, la limite supérieure sur /o/ prenant des valeurs in¬ 
termédiaires entre les limites observées sur /i/ et /a/. En mécanisme M2, la voyelle n’a 
pas d’influence statistiquement significative sur la limite supérieure. Ce résultat est indé¬ 
pendant du sexe du chanteur, de sa catégorie vocale, de son entrainement vocal (allant 
d’amateur à professionnel). Il permet en outre d’expliquer la variabilité des résultats pré¬ 
senté dans la littérature, ne prenant pas en compte les mécanismes laryngés. La théorie 
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(a) Exemple produit par S3, sur un ré3, sur la voyelle (b) Exemple produit par Bar3, sur un sol^2, sur la 
/a/ et en M2. voyelle /a/ et en Ml. 


Fig. 5.12 - Spectrogramme, amplitude du signal EGG et position verticale du larynx pour deux 
productions vocales. Chacune d’elle est constituée d’un crescendo suivi du court son en MO à 
partir duquel les fréquences formantiques ont été estimées. Sur la figure 5.12(a), nous n’observons 
pas de différence de VLP entre le crescendo et la production en MO (en moyenne), alors que 
nous en obervons une sur la figure 5.12(b). 


source-filtre permet d’expliquer les résultats obtenus en mécanisme Ml. Il est nécessaire de 
prendre en compte la spécificité du mécanisme M2 pour comprendre les résultats observés 
dans ce mécanisme. 


2. Influence de la voyelle sur les limites inférieures : 

Nous n’avons pas relevé d’influence de la voyelle sur les limites inférieures, en Ml comme en 
M2. La variabilité inter-sujet est très grande, nous pouvons supposer qu’elle est supérieure 
à la variabilité qu’induirait la voyelle. Elle peut être expliquée par la difficulté de contrôle 
de la pression sous-glottique et l’entrainement des chanteurs à contrôler leurs productions 
dans les différents mécanismes laryngés dans la zone de recouvrement des mécanismes. 

3. Limites inférieures : le non-accolement. 

Certaines zones, de faible intensité et en mécanisme M2, peuvent être produites sans 
accolement détecté des cordes vocales. Ces productions sont très utilisées par les sopranos, 
de manière variable par les hommes, mais pas par les mezzo-sopranos. L’utilisation ou 
non de ce type de production lors de l’enregistrement explique une partie de la variabilité 
inter-chanteur observée sur les limites inférieures. 


4. Ces observations ont plusieurs conséquences qui nous semblent pertinentes pour les chan¬ 
teurs : 

- la différence de limite supérieure entre les phonétogrammes de Ml et de M2 varie 
avec la voyelle. Sur /a/, la limite supérieure obtenue en mécanisme Ml est plus forte 
que celle en M2. Sur /o/ et à plus forte raison sur /i/, la tendance s’inverse à partir 
d’une fréquence dépendant de la voyelle. Dans ces cas-ci, nous n’observons plus le 
décrochage de la limite supérieure sur les phonétogrammes globaux, tant décrit dans 
la littérature. 
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- la dynamique vocale des chanteurs est plus grande sur /a/ que sur joj et sur /i/, 
et cette tendance est plus importante que la variabilité inter-sujet en dessous du do3 
pour les hommes et les femmes en Ml. Elle ne l’est pas en M2. 

- l’aire des phonétogrammes est toujours plus grande dans le mécanisme laryngé prin¬ 
cipalement utilisé en représentation. 

- l’aire de la zone de recouvrement des mécanismes laryngés varie peu avec la voyelle. 
Elle dépend surtout de la tessiture vocale des chanteurs. 


5. Validation des voyelles. 

Nous avons mesuré les fréquences des deux premiers formants sur les productions de MO que 
nous avons demandées. Cette méthode s’est révélée inadaptée pour décrire les ajustements 
vocaliques fins, en particuliers elle ne permet pas de rendre compte du «formant tuning» 
que nous attendions. 


Nous allons maintenant décrire l’influence de la voyelle sur plusieurs paramètres glottiques, 
avant de chercher des hypothèses permettant d’expliquer la différence d’influence de la voyelle 
sur les phonétogrammes de Ml et de M2. 
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Chapitre 6 


Phonétogrammes, voyelles et 
paramètres glottiques 


L’obectif de ce chapitre est d’étudier l’influence de la voyelle sur des paramètres glottiques, 
en Ml et en M2, pour voir dans quelle mesure cette influence diffère d’un mécanisme à l’autre. 
Nous verrons ensuite si cette étude nous apporte des éléments supplémentaires pour comprendre 
les résultats obtenus sur les limites des phonétogrammes. 

Nous avons choisi de travailler sur trois paramètres glottiques : l’amplitude du signal EGG, 
la position verticale du larynx et le quotient ouvert. Nous considérons l’amplitude du signal 
EGG comme un paramètre de source dans la mesure où elle nous permet d’évaluer la surface 
de contact maximale des cordes vocales (au cours de chaque cycle glottique). Il s’agit donc (cf. 
section 1.2) d’un bon indicateur pour discriminer les mécanismes laryngés. Nous allons chercher 
à comprendre, à travers l’étude de ce paramètre, dans quelle mesure l’utilisation du /a/, du 
/i/ ou du joj implique une adaptation de la vibration glottique, et comment cela se traduit en 
termes de surface de contact des cordes vocales, et ce en mécanisme Ml et en M2. De manière 
analogue, nous allons chercher à comprendre dans quelle mesure la position du larynx et le 
quotient ouvert varient de la même manière avec la voyelle, en Ml et en M2. 


Méthodologie d’étude 

Les trois paramètres que nous étudions peuvent, a priori, être corrélés à d’autres paramètres 
que le mécanisme laryngé et la voyelle. Parmi ces paramètres, nous considérerons particuliè¬ 
rement la hauteur et l’intensité, soient les deux dimensions du phonétogramme. Quand nous 
comparons des valeurs prises d’un paramètre donné, les autres étant constants, nous nous de¬ 
vons d’expliciter quels sont ces autres paramètres. Nous avons fait le choix, pour cette étude, 
d’effectuer systématiquement des comparaisons à hauteur et intensité fixées. Dans ces conditions, 
une méthode simple pour représenter les variations d’un paramètre en fonction de la hauteur et 
de l’intensité simultanément consiste à faire figurer dans un phonétogramme les valeurs prises 
par ce paramètre dans une troisième dimension (ou par une échelle de couleur). Nous obtenons 
alors un phonétogramme de paramètre. 

Ce choix de méthodologie a une conséquence importante : nous comparerons les mécanismes 
Ml et M2 dans leur zone de recouvrement, et nous ne comparons les différentes voyelles, en Ml et 
en M2, que dans leurs zones communes. Comme nous l’avons vu, les limites phonétographiques 
sont les mêmes en fonction de la voyelle en M2, donc ce choix a peu d’incidence en ce qui 
concerne le mécanisme M2. En Ml, comme les limites supérieures des phonétogrammes diffèrent 
en fonction de la voyelle, nous prendrons en compte la totalité de la dynamique du chanteur sur 
la voyelle /i/, mais seulement une partie de la dynamique sur le /a/. Néanmoins, en termes de 
niveau SPL, les aires prises en compte sont les mêmes. 

Nous proposons maintenant de présenter les travaux développés sur ces trois paramètres et 
de voir ce qu’ils apportent par rapport à notre problématique. 
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6.1 Phonétogrammes et amplitude du signal EGG 

L’amplitude du signal EGG est un indicateur intéressant puisqu’il nous renseigne sur la 
surface d’accolement des cordes vocales (Childers et al ., 1984, 1990). Elle est notamment utilisée 
pour détecter des transitions de mécanisme laryngé (Roubeau, 1993; Roubeau et a/., 1987; 
Miller et al ., 2002). La connaissance de cette amplitude peut donc nous fournir de précieux 
renseignements quant au fonctionnement glottique. 

L’examen de l’amplitude du signal électroglottographique est cependant un exercice délicat. 
En effet ce signal souffre des défauts suivants : 

- ce signal n’est pas calibré, c’est-à-dire que son unité est le volt, et qu’il ne peut pas être 
converti en mm 2 (à moins de pouvoir mesurer la surface d’accolement par un autre moyen, 
ce qui n’est pas possible aujourd’hui). 

- le signal d’amplitude varie d’un chanteur à l’autre, du fait des différences morphologiques 
de leurs cous. Dans la mesure où le signal n’est pas calibré, nous ne pouvons a priori pas 
comparer l’amplitude du signal entre deux chanteurs. 

- ce signal est aussi sensible à la position relative du larynx par rapport aux électrodes. 
L’amplitude varie donc avec la position verticale du larynx. L’utilisation de doubles élec¬ 
trodes atténue ce défaut mais ne l’annihile vraisemblablement pas. L’amplitude du signal 
EGG varie aussi sur l’ensemble de la séance si les électrodes ne sont pas suffisamment bien 
plaquées sur le cou du chanteur. 

Pour contourner les deux premières difficultés, nous avons normalisé l’amplitude de l’EGG : 
pour chaque chanteur, l’amplitude du signal EGG est divisée par l’amplitude maximale observée 
chez ce chanteur. L’amplitude de l’EGG peut alors varier de 0 à 100. Néanmoins nous garde¬ 
rons à l’esprit dans nos comparaisons entre chanteurs que le maximum d’amplitude mesurée 
ne correspond pas nécessairement à la «même» situation laryngée (en terme de position du la¬ 
rynx par rapport aux électrodes et de maximum de surface de contact possible). Une deuxième 
conséquence est qu’il reste sujet à caution quant à sa comparaison entre le début et la fin de 
l’enregistrement. Néanmoins, compte tenu de l’ordre dans lequel le protocole a été enregistré, les 
productions sur les trois voyelles à hauteur et mécanisme donné, n’étaient jamais très éloignées 
dans le temps. Nous pourrons donc nous permettre cette étude. 

6.1.1 Méthode d’estimation de l’amplitude du signal EGG 

Nous avons utilisé une méthode d’estimation de l’amplitude du signal EGG proposée et pro¬ 
grammée par Boris Doval, inspirée de la méthode d’estimation de l’enveloppe spectrale appelée 
«true envelope» (Rôbel et Rodet, 2005). Il s’agit d’une méthode itérative permettant, dans son 
utilisation première, d’affiner le calcul des coefficients cepstraux. Dans l’utilisation que nous en 
avons faite, chaque itération consiste en un filtrage passe-bas et une addition. 

Partant de la partie positive du signal EGG (Aq — max(0,egg)), l’amplitude du signal Ai 
estimée lors de la i ieme itération est calculée par : 


Ai = max(egg,Ai-i) 

L’amplitude Ai obtenue est ensuite filtrée passe-bas, la fréquence de coupure étant à affiner en 
fonction du signal de départ. Dans notre cas, nous avons choisi comme fréquence de coupure 
min(/o)/3. L’algorithme s’arrête au bout de 20 itérations, ou quand l’enveloppe estimée vaut au 
pire 99 % de l’amplitude du signal EGG. 

Cette méthode permet donc d’estimer l’enveloppe supérieure du signal EGG, il suffit d’ap¬ 
pliquer le même algorithme sur l’opposé du signal EGG pour obtenir l’enveloppe inférieure. 
L’amplitude que nous avons étudiée correspond à la différence entre l’enveloppe supérieure et 
l’enveloppe inférieure. 

Notons que l’algorithme décrit ci-dessous calcule une enveloppe sur l’ensemble des signaux 
d’entrée, qu’ils soient voisés ou non. Nous avons vu dans la section 5.4 que pour certaines 
productions, associées la plupart du temps au mécanisme M2, aucun accolement glottique n’était 
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détecté, ce qui se traduit au niveau du signal EGG par une très faible amplitude. Pour l’ensemble 
des statistiques présentées ci-après à propos de l’amplitude de l’EGG, nous n’avons pris en 
compte que les données pour lesquelles un accolement est détecté. 

6.1.2 Variation de l’amplitude de l’EGG avec la hauteur et l’intensité 

L’ensemble des phonétogrammes d’amplitude de l’EGG est présenté en annexe E. 
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Fig. 6.1 - Phonétogramme d’amplitude de l’EGG (exprimée en %). Chanteur : B3, voyelle /a/. 





Fig. 6.2 - Phonétogramme d’amplitude de l’EGG (exprimée en %). Chanteur: MSJ^, voyelle 
/a/. 


Les figures 6.1 et 6.2 présentent deux exemples de phonétogrammes d’amplitude de l’EGG. 
Nous observons chez les deux chanteurs une augmentation de l’amplitude de l’EGG avec le SPL. 
Nous pouvons également, chez MS4 et en mécanisme Ml, relever une augmentation d’amplitude 
de l’EGG avec la hauteur, si bien que la zone maximale correspond aux hautes fréquences et 
hautes intensités. 

Le tableau 6.1 présente les coefficients de corrélation partielle entre l’amplitude de l’EGG et 
la hauteur d’une part, et l’intensité d’autre part. Avant de présenter les résultats, rappelons que 
le coefficient en corrélation varie entre -1 et 1, qu’il évalue le caractère linéaire d’une liaison. Le 
signe du coefficient nous renseigne quant au sens de variation du paramètre étudié (l’amplitude 
de l’EGG ici) avec la hauteur ou l’intensité. S’il est négatif, cela signifie que l’amplitude de l’EGG 
diminue quand l’intensité (resp. la hauteur) augmente. Un coefficient de corrélation proche de 0 
signifie que les deux variables étudiées ne sont pas fortement corrélées linéairement (c’est-à-dire 
soit que la liaison n’est pas linéaire, soit que les paramètres sont indépendants). Précisons que 
du fait de son mode de calcul, le coefficient de corrélation ne varie pas si l’on change linéairement 
l’échelle d’un des paramètres testés. Cela signifie qu’étudier l’amplitude de l’EGG en fonction de 
la hauteur en demi-tons ou en Hertz changera les coefficients de corrélation (puisque la liaison 
entre les demi-tons et les Hertz n’est pas linéaire), mais la renormalisation du signal EGG (ou 
du VLP) ne le modifie pas. Nous avons choisi d’exprimer la hauteur en demi-tons car cette 
unité est plus proche de la perception humaine de la hauteur que le Herz. Enfin, le coefficient de 
corrélation partielle permet de prendre en compte la dépendance entre la fréquence et l’intensité 
que nous avons relevée sur les phonétogrammes. 

Nous présentons dans le tableau 6.1 uniquement les résultats sur la voyelle /a/. 
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Ml 

M2 

chanteur 

fo 

Idb 

fo 

Idb 

si 

0.14 

0.55 

-0.48 

0.87 

S2 

- 0.85 

0.91 

-0.51 

0.84 

S3 

- 0.70 

0.66 

-0.64 

0.72 

S4 

- 0.75 

0.82 

-0.57 

0.83 

MSI 

- 0.79 

0.84 

-0.61 

0.91 

MS2 

- 0.79 

0.82 

- 0.71 

0.87 

MS3 

0.57 

0.87 

-0.25 

0.74 

MS4 

0.48 

0.81 

-0.58 

0.76 

CTI 

-0.02 

0.35 

-0.54 

0.80 

CT2 

-0.22 

0.4 

-0.28 

0.63 

Tl 

- 0.79 

0.47 

-0.68 

0.82 

T2 

0.37 

0.57 

-0.46 

0.75 

T3 

0.75 

0.28 

0.30 

0.40 

T4 

0.47 

0.73 

0.17 

0.85 

Barl 

-0.076 

0.54 

0.32 

0.75 

Bar2 

-0.60 

0.70 

-0.54 

0.80 

Bar3 

0.26 

0.36 

0.19 

0.52 

Bar4 

-0.01 

0.69 

-0.17 

0.78 

B1 

0.25 

0.30 

-0.38 

0.67 

B2 

0.28 

-0.01 

- 0.85 

0.80 

B3 

-0.26 

0.73 

-0.54 

0.79 


Tab. 6.1 - Coefficients de corrélation partielle entre Vamplitude du signal EGG 
(en demi-tons) ou Vintensité, pour chaque chanteur, chaque mécanisme laryngé, 
/a/. Les corrélations fortes (supérieures à 0.7 en valeur absolue) figurent en gras. 


et la hauteur 
et la voyelle 
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En mécanisme Ml, nous avons relevé cinq corrélations fortes et négatives avec la hauteur 
chez les femmes. Pour quatre d’entre elles, nous relevons également une corrélation positive forte 
avec l’intensité. Il semblerait donc que pour ces chanteuses, l’amplitude du signal EGG soit 
maximale dans le grave fortissimo du mécanisme Ml. Il est intéressant de constater que nous 
n’observons pas cette tendance de façon aussi marquée chez les hommes. La surface d’accolement 
des cordes vocales varie donc différemment avec la hauteur et l’intensité en fonction des sujets, 
soit en raison de différences physiologiques, soit à cause d’une utilisation différente du larynx (les 
femmes chantent habituellement en mécanisme M2) implicant une différence dans l’entrainement 
vocal. Ces observations sont en accord avec celles de Hacki (1996). 

En mécanisme M2, la tendance est beaucoup plus tranchée et commune aux deux sexes : 
nous observons que toutes les femmes et neuf hommes sur treize présentent une corrélation forte 
avec l’intensité, alors que seuls un homme et une femme en présentent avec la hauteur. De façon 
générale donc, l’amplitude du signal EGG semble très fortement liée à l’intensité en mécanisme 
M2. Comme la corrélation présentée ici est partielle, la liaison explicitée est avec une intensité 
décorrélée de la fréquence, ce qui correspond à une position verticale dans le phonétogramme, 
relativement aux limites inférieure et supérieure. L’amplitude de l’EGG a donc tendance à 
augmenter avec l’intensité en mécanisme M2. 



Ml 

M2 

/a/ 

N 

M 

/a/ 

N 

M 

Hommes 

+ 

1 

0 

0 

0 

0 

0 

Femmes 

+ 

0 

0 

0 

0 

0 

0 

Hommes 

- 

1 

1 

2 

1 

4 

4 

Femmes 

- 

5 

3 

1 

1 

5 

1 


Tab. 6.2 - Nombre de coefficients de corrélation partielle forte, positifs et négatifs, entre Vam- 
plitude du signal EGG et la hauteur (en demi-tons), pour les hommes et les femmes séparément 
et pour chaque voyelle. 



Ml 

M2 

/a/ 

N 

M 

/a/ 

N 

lof 

Hommes 

+ 

2 

2 

2 

9 

9 

9 

Femmes 

+ 

6 

4 

5 

7 

8 

8 

Hommes 

- 

0 

0 

0 

0 

0 

0 

Femmes 

- 

0 

0 

0 

0 

0 

0 


Tab. 6.3 - Nombre de coefficients de corrélation partielle forte, positifs et négatifs, entre Vam¬ 
plitude du signal EGG et l’intensité, pour les hommes et les femmes séparément et pour chaque 
voyelle. 

Les tableaux 6.2 et 6.3 présentent le nombre de corrélations partielles fortes constatées entre 
l’amplitude de l’EGG et la hauteur d’une part, et entre l’amplitude de l’EGG et l’intensité 
d’autre part, pour les hommes et pour les femmes séparément. La tendance la plus marquée 
est la corrélation forte (et positive) que nous observons chez les hommes et les femmes, sur 
les trois voyelles, en mécanisme M2. Nous retrouvons ce type de corrélation en mécanisme Ml, 
mais surtout chez les femmes. Du tableau 6.2 nous pouvons constater que la corrélation entre 
l’amplitude de l’EGG et la fréquence est beaucoup moins répandue, elle est négative dans presque 
tous les cas (c’est à dire que l’amplitude diminue quand la fréquence augmente). De plus, elle 
est plus marquée sur la voyelle /a/ en Ml et sur la voyelle j\j en M2, en particulier chez les 
femmes. 

6.1.3 Influence du mécanisme laryngé sur l’amplitude de l’EGG 

Nous avons déjà approché l’influence du mécanisme laryngé sur l’amplitude du signal EGG 
lors du paragraphe précédent. Nous avons vu que la liaison entre l’amplitude EGG et l’intensité 
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n’était pas la même. Nous présentons figure 6.3 des ordres de grandeur de l’amplitude EGG 
dans la zone de recouvrement des mécanismes laryngés. 
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Fig. 6.3 - Statistiques de la différence d'amplitude du signal EGG entre les productions de Ml 
et celles de M2, à même hauteur et même intensité. Les résultats sont détaillés pour chaque 
chanteur et chaque voyelle. 

Cette figure nous permet de constater que la plupart des valeurs observées sont positives, 
ce qui signifie que l’amplitude du signal EGG est plus grande en mécanisme Ml qu’en M2. Ce 
résultat confirme tout à fait les études menées sur les transitions de mécanisme laryngé, qui 
décrivent une diminution de l’amplitude de l’EGG lors de transitions M1-M2 (Roubeau et al ., 
1987, 1989; Roubeau, 1993; Roubeau et al ., 2009). Nous constatons également que cette influence 
du mécanisme laryngé se retrouve sur les trois voyelles étudiées. 


6.1.4 Influence de la voyelle sur l’amplitude de l’EGG 

Nous nous restreindrons aux voyelles /a/ et /i/. 

La figure 6.4 présente l’ensemble des valeurs médianes, les intervalles interquartiles et les 
valeurs adjacentes supérieures et inférieures des différences d’enveloppes mesurées à hauteur et 
intensité fixées, entre les voyelles /a/ et /i/. L’examen de cette figure ne laisse pas apparaitre de 
tendance marquée. Notons néanmoins que 15 des 21 chanteurs ont une valeur médiane positive 
en mécanisme Ml et 11 en mécanisme M2. Certains chanteurs présentent une tendance assez 
nette comme Bar4 ou S4 en Ml. Pour ces chanteurs, l’amplitude de l’EGG est plus grande sur 
/i/ que sur /a/. 

Il est compliqué d’analyser les résultats de façon plus détaillée, tant les sources de variations 
de l’amplitude de l’EGG sont nombreuses. Nous allons maintenant examiner un cas particulier ; 
celui de CTI qui, à la fin de sa séance d’enregistrement, a produit plusieurs exemples de chan¬ 
gements de voyelles sur une note tenue. Seules les voyelles /a/ et /i/ ont été explorées, et toutes 
ces productions ont été émises en mécanisme M2. La figure 6.5 présente une de ces productions. 
Sur le spectrogramme nous voyons vers 2.1 s une modification radicale de la fréquence des deux 
premiers formants, traduisant le changement de voyelle du /a/ au /i/ : Fl diminue et F2 aug¬ 
mente. L’intensité est stable à 85 dB sur /a/, elle baisse très légèrement sur /i/ et un vibrato 
d’amplitude se déclenche, en phase avec le vibrato de fréquence. Cela traduit le fait que sur cette 
voyelle et à cette hauteur, CTI a placé son Fl juste au-dessus de la fréquence fondamentale. 
Quand fO augmente, H1 se rapproche de Fl, donc l’intensité augmente, et quand fO diminue, H1 
s’éloigne de Fl, et donc l’intensité diminue également. La courbe de fO ne laisse pas apparaitre 
de modification de fréquence moyenne, ni du vibrato, lors du changement de voyelle. La courbe 
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SI S2 S3 S4 MSI MS2 MS3 MS4 CTI CT2 Tl T2 T3 T4 Barl Bar2 Bar3 Bar4 B1 B2 B3 



Fig. 6.4 - Statistiques de la différence d’amplitude du signal EGG entre les productions sur /a/ 
et celles sur /i/(env(/i/) — env(/a/)), à meme hauteur et même intensité, en mécanisme Ml 
(figure de haut) d’une part, et M2 (figure du bas) d’autre part. Les résultats sont détaillés pour 
chaque chanteur. 


d’amplitude de l’EGG en revanche, traduit une augmentation de 10% lors du changement de 
voyelle, ce qui est tout à fait en accord avec les valeurs présentées pour ce chanteur en M2 dans la 
figure 6.4. Cette figure est particulièrement intéressante, car sur cette production le chanteur n’a 
globalement pas modifié la position verticale de son larynx avec la voyelle. En effet le VLP varie 
légèrement, mais pas en même temps que la voyelle, et prend les mêmes valeurs sur /a/ et sur 
/i/. Cet exemple particulier montre que le changement de voyelle du /a/ vers le j\j implique une 
augmentation de l’amplitude du signal EGG, qui traduit probablement une augmentation de la 
surface de contact glottique, en mécanisme M2. À titre de comparaison, nous avons également 
présenté la figure 6.6, qui correspond à une production similaire à celle de la figure 6.5. Il s’agit 
d’un passage de la voyelle /a/ au /i/, toujours par CTI en M2 sur le do3. Nous constatons aussi 
l’augmentation de l’amplitude de l’EGG lors du changement de voyelle, mais ce changement est 
ici associé à une diminution du VLP. La situation la plus rencontrée est celle présentée figure 
6.6 avec une variation de VLP lors de la transition, mais la figure 6.5 nous permet d’affirmer 
que la modification d’amplitude de l’EGG tient bien d’une modification de la surface des cordes 
vocales et non d’une variation de la position verticale du larynx. 

Nous nous en tiendrons provisoirement à ces constatations. En effet la discussion de ces 
résultats nécessite préalablement d’étudier la position verticale du larynx. Nous reviendrons sur 
l’amplitude du signal EGG dans la partie 6.2.3. 


6.2 Phonétogramme et position verticale du larynx 

La position verticale du larynx est l’objet d’une attention particulière de beaucoup de pro¬ 
fesseurs de chant. Selon bien des méthodes de chant le larynx doit être maintenu bas (dans le 
chant lyrique) par rapport à la position de repos ou la position de parole, ce qui a été observé 
dans plusieurs études (Shipp, 1987; Shipp et Izdebski, 1975; Sundberg, 1970; Pillot, 2004). Cer¬ 
tains styles musicaux requièrent au contraire un larynx haut. Physiologiquement, la position 
du larynx est très importante car d’une part elle peut influencer la vibration glottique, d’autre 
part elle permet au chanteur de modifier légèrement la longueur de son conduit vocal (donc 
les fréquences formantiques). Dans cette partie, nous allons chercher à déterminer si la voyelle 
influence la position verticale du larynx, et si cette influence est la même en mécanisme Ml et 
en M2. Cette étude nécessite de déterminer au préalable si la position verticale du larynx varie 
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Fig. 6.5 - Exemple de note tenue chantée par CTI, avec changement de voyelle (début sur /a/, 
fin sur /i/). Note: do3, mécanisme M2 (exemple sonore 5). 
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Fig. 6.6 - Deuxième exemple de note tenue chantée par CTI, avec changement de voyelle (dé¬ 
but sur /a/, fin sur /i/). Note: do3, mécanisme M2 (exemple sonore 6). Contrairement à la 
production présentée figure 6.5, la variation de Vamplitude du signal EGG s’accompagne d’une 
variation de position verticale du larynx. 
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avec la hauteur et l’intensité. 


VLP et hauteur, intensité 

Chez des sujets non-chanteurs, la position du larynx est habituellement corrélée à la hau¬ 
teur (Shipp et Izdebski, 1975; Shipp, 1975). Chez les chanteurs il en va autrement. Pabst et 
Sundberg (1993) ont effectué des mesures de la position verticale du larynx à l’aide d’un élec- 
troglottographe. Ils ont travaillé avec trois chanteuses et quatre chanteurs (sans distinguer les 
mécanismes laryngés). Ils n’ont pas décelé de dépendance du VLP avec la hauteur chez les 
hommes, ni chez les femmes dans «le grave» de leur tessiture. Ces résultats sont en accord avec 
ceux de Shipp et al. (1984) et de Neuschàfer-Rube et al. (1996). La dépendance à l’intensité leur 
est aussi apparue très dépendante du sujet. 


VLP et voyelles 

Dans le domaine de la parole, Ahmad et al. (2009) ont établi par des mesures IRM que le larynx 
était plus haut sur j\j que sur /a/ et /u/ (travaillant avec cinq hommes et cinq femmes comme 
sujets). Sundberg (1970) observe la même tendance en voix parlée, ainsi qu’en voix chantée dans 
une moindre mesure. Selon lui, comme le larynx est maintenu dans une position basse dans le 
chant, ses mouvements dus aux voyelles sont réduits. Notons que Sundberg a travaillé avec quatre 
basses, chantant vraisemblablement en Ml (et à partir d’images du conduit vocal obtenues par 
rayons X). Pillot (2004) a trouvé que le larynx était statistiquement significativement plus haut 
sur j\j que sur /a/ et /u/ dans le chant, alors que la position de l’os hyoïde reste la même. Elle 
a travaillé avec un sujet (basse), à 100 Hz et 150 Hz, donc aussi en mécanisme Ml, en effectuant 
une IRM du conduit vocal. Elliot et al. (1997) trouvent des résultats similaires, en ayant travaillé 
avec cinq sujets, trois hommes et deux femmes (et en ayant mesuré le VLP avec l’EGG). La 
hauteur à laquelle les productions ont été effectuées n’est pas précisée. 

Globalement, il semble donc que la tendance observée dans la parole se retrouve dans une 
certaine mesure dans le chant, en notant cependant que ces études ont été effectuées dans le 
grave, vraisemblablement en mécanisme Ml. Nous allons donc voir si nous retrouvons cette 
tendance en mécanisme Ml, et si elle se vérifie en mécanisme M2. 


VLP et mécanismes laryngé 

L’influence du mécanisme laryngé sur le VLP n’a pas encore été étudiée. Comme nous l’avons 
mentionné dans le paragraphe précédent, les recherches ont toutes porté sur de la voix grave, 
que nous attribuons donc au mécanisme Ml. Nous allons voir comment le mécanisme influence 
la position verticale du larynx, pour pouvoir ensuite observer les différences d’influence de la 
voyelle entre les mécanismes Ml et M2. 

6.2.1 Variation du VLP avec la hauteur et l’intensité 

Le tableau 6.4 présente les coefficients de corrélation partielle mesurés sur la base de données. 
Parmi l’ensemble des valeurs relevées, seules huit corrélations fortes sont observées. Sept d’entre 
elles portent sur la corrélation entre le VLP et la hauteur en mécanisme Ml, mais deux sont 
négatives et les cinq autres positives. 

Nous observons également qu’aucune régularité n’apparait dans le tableau concernant le 
signe des coefficients. 

Bien que contenant des données intéressantes (nous pouvons par exemple dire que SI, S2, 
MSI et MS3 ont tendance à baisser leur larynx quand elles augmentent d’intensité en mécanisme 
M2), ce tableau ne nous permet pas de mettre en évidence une quelconque tendance globale, 
conformément aux études effectuées précédemment sans prendre en compte les mécanismes 
laryngés. Nous pouvons déduire de notre étude qu’il n’existe pas de tendance claire quand à la 
variation de la hauteur du larynx avec la hauteur ou l’intensité, que ce soit en mécanisme Ml 
ou en M2. 
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Ml 

M2 

chanteur 

/o 

Idb 

/o 

Idb 

SI 

-0.01 

-0.04 

-0.10 

-0.44 

S2 

0.79 

0.03 

-0.40 

-0.33 

S3 

-0.84 

0.53 

-0.32 

0.15 

S4 

0.60 

0.08 

0.44 

0.23 

MSI 

0.82 

-0.26 

0.36 

-0.55 

MS2 

-0.00 

0.13 

0.30 

0.21 

MS3 

0.18 

-0.50 

-0.67 

-0.50 

MS4 

-0.27 

0.33 

-0.42 

0.55 

CTI 

-0.45 

0.02 

-0.83 

0.23 

CT2 

0.75 

0.37 

-0.63 

-0.10 

Tl 

-0.40 

-0.17 

0.11 

-0.22 

T2 

-0.69 

0.47 

-0.13 

-0.03 

T3 

0.76 

-0.35 

0.12 

-0.30 

T4 

-0.71 

-0.17 

-0.41 

-0.35 

Barl 

0.68 

-0.27 

0.27 

0.19 

Bar2 

-0.27 

0.07 

0.27 

-0.57 

Bar3 

0.71 

-0.50 

-0.61 

-0.34 

Bar4 

-0.04 

0.31 

0.39 

-0.02 

B1 

-0.49 

0.00 

0.45 

-0.52 

B2 

-0.04 

0.11 

-0.23 

0.17 

B3 

0.43 

-0.24 

-0.04 

0.23 


Tab. 6.4 - Coefficients de corrélation partielle entre le VLP, la hauteur (en demi-tons) ou 
Vintensité, pour chaque chanteur, chaque mécanisme laryngé. Les corrélations fortes (supérieures 
à 0.7 en valeur absolue) figurent en gras. Voyelle: /a/. 
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6.2.2 Influence du mécanisme laryngé 
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Fig. 6.7 - Statistiques de la différence de VRP entre les productions de Ml et celles de M2 
(VLP(M 1) — VLP(M2)), à meme hauteur et même intensité. Les résultats sont détaillés pour 
chaque chanteur et chaque voyelle. 

La figure 6.7 présente la différence observée de VLP entre les productions de Ml et celles 
de M2, dans la zone de recouvrement. Comme pour le tableau 6.4, nous pouvons observer une 
grande variabilité des résultats, qui peuvent être très marqués dans certains cas. Par exemple, 
la tendance qu’a Tl à chanter avec un larynx plus haut en M2 qu’en Ml sur la voyelle /o/ ne 
fait aucun doute. La position du larynx dans le chant serait donc très personnelle. 

Si nous étudions les chanteurs de mécanisme M2 (femmes et contre-ténors) par rapport aux 
autres, nous constatons que les premiers sont cinq sur dix à avoir un larynx plus bas en M2 qu’en 
Ml sur /a/ et /o/, et sept sur dix sur la voyelle /i/. Les chanteurs de Ml sont cinq sur onze sur 
/a/ et sur /i/ et trois sur /o/ dans cette situation. Les chanteurs de M2 auraient donc tendance 
à abaisser plus leur larynx en M2 qu’en Ml (dans la zone de recouvrement des mécanismes), et 
ce serait l’inverse pour les chanteurs de Ml. Cette tendance mériterait d’être confirmée par des 
méthodes plus fiables d’estimation de la position du larynx. 

6.2.3 Influence de la voyelle 

La figure 6.8 présente l’ensemble des valeurs médianes, des intervalles interquartiles et des 
valeurs adjacentes supérieures et inférieures des différences de VLP observées à hauteur et in¬ 
tensité fixées, entre les voyelles /a/ et /i/, en Ml d’une part, et en M2 d’autre part. Cette 
figure confirme naturellement les descriptions déjà détaillées sur la position verticale du larynx: 
celle-ci dépend du chanteur, et l’influence de la voyelle dépend également du chanteur : il y a 
des chanteurs comme S3 (en mécanisme Ml) qui émettent un /a/ avec un larynx plus haut que 
quand ils émettent un /i/, d’autres comme Bar2 pour lesquels ce n’est pas le cas. 

Parmi les chanteurs de mécanisme M2, nous constatons que quatre d’entre eux (S2, S3, MSI, 
CT2) chantent avec un larynx plus haut sur /i/ que sur /a/ en Ml, seules SI et MS3 montrent 
clairement une tendance inverse. Ils sont six (SI, S4, MSI, MS2, MS4, CTI) à avoir le larynx 
plus bas sur /i/ que sur /a/ en M2. Les chanteurs de Ml sont six (Tl, T4, Barl, Bar4, Bl, B2) 
à avoir le larynx plus haut sur /i/ en Ml, et sept (T2, T3, Barl, Bar2, Bar4, B2, B3) en M2. 
La tendance «majoritaire» semble être partagée en Ml entre les deux catégories de chanteurs, 
mais opposée en M2 : les chanteurs de M2 semblent plutôt chanter avec un larynx plus bas sur 
/i/ que sur /a/, alors que c’est l’inverse pour les chanteurs de Ml (qui sont donc non entrainés 
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Fig. 6.8 - Statistiques de la différence de VLP entre les productions sur /a/ et celles sur 
/i/(VLP(/i/) — VLP(/a/)), à même hauteur et même intensité, en mécanisme Ml (figure 
de haut) d’une part, et M2 (figure du bas) d’autre part. Les résultats sont détaillés pour chaque 
chanteur. 

en M2). 

Notre étude montre donc que la tendance générale décrite dans la littérature ne vaut que 
pour le mécanisme Ml. En mécanisme M2, les personnes entraînées dans ce mécanisme montrent 
plutôt la tendance inverse. Le mécanisme laryngé, associé à l’utilisation que les chanteurs en ont, 
influence donc la position verticale du larynx. 

Voyelle, VLP, amplitude de l’EGG : Discussion 

La différence entre voix parlée et voix chantée vient en partie des différences articulatoires 
entre les voyelles parlées et chantées. Cette différence est particulièrement importante pour la 
voyelle /i/ en terme de position de la langue, donc de forme du conduit vocal (Sundberg, 1970). 
La position abaissée du larynx en voix chantée tend également à abaisser les fréquences des 
formants (Sundberg et Nordstrom, 1976). 

Les relations entre voyelles et larynx peuvent être de plusieurs types. Nous développerons 
particulièrement les aspects acoustiques et physiologiques. 

Les aspects acoustiques sont décrits en termes d’interaction source-filtre. Nous savons que 
le formant tuning correspond à une situation recherchée dans le chant (voir partie 1.4.2). Titze 
(2004) a montré en modélisant les impédances sous-glottique, sus-glottique et glottique que 
l’ajustement d’un harmonique juste sous un formant impliquait une augmentation de MFDR 
(Maximum Flow Déclination Rate, équivalent au paramètre d’excitation maximale E de Doval 
et al., 2006). Ce paramètre correspond à la vitesse du débit glottique au moment où la glotte se 
referme. Théoriquement donc, la voyelle /i/, dont la fréquence du premier formant est beaucoup 
plus basse que celle du /a/, devrait être émise avec un MFDR plus grand que /a/ (le reste 
étant constant). Il est intéressant de constater que nous avons trouvé une surface de contact 
globalement plus grande sur /i/ que sur /a/. Une étude complémentaire est néanmoins nécessaire 
pour établir si il y a ou non une relation de cause à effet entre ces deux résultats. 

En termes de physiologie, nous savons que la langue et le larynx ne sont pas indépendants (cf. 
section 1.1). La langue est reliée à l’os hyoïde, qui est un os indépendant du reste du squelette. 
Ce dernier est lui-même relié au larynx, par le muscle thyro-hyoïdien. La position verticale du 
larynx est régulée par différents muscles extrinsèques : la contraction du muscle thyro-hyoïdien a 
tendance à le faire monter. D’autre muscles extrinsèques comme le sterno-thyroïdien tendent à 
l’abaisser (Shipp, 1977). Pour une activité donnée du thyro-hyoïdien, le changement de position 
de langue en passant d’un /a/ au /i/ pourrait expliquer la montée du larynx, notamment en 
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voix parlée. D’après Sundberg et Nordstrom (1976), la montée du larynx pourrait être liée à une 
augmentation de l’adduction des cordes vocales, ce qui expliquerait l’augmentation de la surface 
de contact que nous avons constatée. 

L’influence du mécanisme laryngé est également peu explicite, car très peu d’études ont porté 
sur la position verticale du larynx en Ml et en M2. Shipp (1975) n’a pas constaté de modifications 
de l’activité des muscles extrinsèques ni intrinsèques lors d’un passage M1^M2 d’un glissando 
(alors qu’il a relevé un saut de fréquence). Sonninen et al. (1999) ont observé la position du 
larynx chez une chanteuse entrainée, et ont constaté une modification de la position du larynx 
lors du «passage» (situé par les auteurs autour de fa3). Une étude approfondie du mécanisme 
M2 semble faire défaut pour comprendre pourquoi les chanteurs de mécanisme M2 ont plutôt 
tendance à abaisser leur larynx sur la voyelle /i/ par rapport au /a/. 

6.2.4 Validité des mesures 

L’estimation de la position verticale du larynx par l’électroglottographe à deux électrodes 
( two-electrodes-pairs multichanel EGG ) est considérée correcte par Rothenberg (1992) dans la 
mesure où les électrodes sont placées correctement, c’est à dire que le larynx au repos est centré 
par rapport aux électrodes, et pour de petits mouvements du larynx, inférieurs à 1.5 cm. Dans 
cette situation, le signal de larynx tracking délivré par l’EGG peut être considéré comme étant 
directement proportionnel à la position verticale du larynx, exprimé en centimètres. 

Elliot et al. (1997) ont également utilisé un tel électroglottographe pour estimer la position 
verticale du larynx. Ils ont testé la validité de la mesure, d’une part en relevant visuellement la 
variation de position du larynx par rapport à la position de repos, d’autre part en faisant varier 
la position des électrodes sur le cou. Selon les deux méthodes, les auteurs ont confirmé la validité 
de la mesure de VLP sous les conditions données par Rothenberg. Laukkanen et al. (1999) ont 
également testé la méthode de mesure du VLP par l’EGG, en effectuant des mesures simultanées 
avec l’électroglottographe et par vidéofluoroscopie. Ils relèvent une bonne concordance des deux 
méthodes de mesure dans l’ensemble. 


6.3 Influence de la voyelle sur le quotient ouvert 

Le quotient ouvert est, comme l’amplitude du signal EGG ou la position verticale du larynx, 
un paramètre glottique. Néanmoins son statut est un peu différent dans la mesure où il peut 
être également considéré comme un paramètre acoustique. En effet il s’agit aussi d’un des cinq 
paramètres permettant de décrire la forme d’une onde de débit glottique (cf. partie 1.1.3). De 
par l’étude de l’influence de la voyelle sur le quotient ouvert en Ml et en M2 que nous allons 
maintenant présenter, nous verrons ce que cette influence nous apporte quant à l’influence de la 
voyelle sur les limites phonétographiques. 

Ml M2 
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fa#1 do2 fa#2 do3 fa#3 do4 fa#4 do5 fa#1 do2 fa#2 do3 fa#3 do4 fa#4 do5 

Fig. 6.9 - Phonétogramme de quotient ouvert, en Ml (gauche) et en M2 (droite). Voyelle: /a/, 
chanteur : CTI 
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Le quotient ouvert a été étudié en détail par Henrich (2001) : le quotient ouvert varie en 
fonction du mécanisme laryngé. Il prend des valeurs faibles (de 0.3 à 0.8) en Ml, et plus grandes 
(de 0.5 à 0.95) en M2. Le quotient ouvert varie également avec d’autres paramètres: il est 
inversement corrélé à l’intensité en mécanisme Ml, ce qui n’est pas le cas en M2. Il peut être 
inversement corrélé à la fréquence fondamentale en M2. Un exemple de phonétogramme de 
quotient ouvert est présenté figure 6.9. Nous pouvons notamment y vérifier la corrélation entre 
Oq et SPL en mécanisme Ml, ainsi que la différence très marquée entre les valeurs mesurées en 
Ml et en M2. La variation du quotient ouvert avec le mécanisme laryngé, ainsi qu’avec le SPL 
ou la fréquence n’est pas réétudiée dans ce manuscrit. 

Les phonétogrammes de la figure 6.9 ont été obtenues sur la voyelle /a/. Obtenons-nous 
des résultats similaires sur les autres voyelles? Dans quelle mesure la voyelle influence-t-elle le 
quotient ouvert? Nous allons maintenant détailler la méthode de calcul du quotient ouvert que 
nous avons utilisée, avant d’exposer les résultats. 


6.3.1 Méthodes de calcul du quotient ouvert 

Il existe plusieurs méthodes de calcul du quotient ouvert, basées ou non sur le signal EGG. 
La difficulté d’estimation du quotient ouvert réside dans la difficulté d’estimation précise des ins¬ 
tants d’ouverture et de fermeture glottique. Plusieurs méthodes existent, basées sur un seuillage 
de l’EGG, ou sur une détection des pics d’ouverture et/ou de fermeture du signal DEGG. Dans 
cette thèse, nous avons choisi d’estimer le quotient ouvert par la méthode «decom» développée 
par Henrich (2001). Cette méthode est basée sur une estimation de la période fondamentale 
ainsi que de la durée de la phase ouverte en effectuant une auto-corrélation sur le signal DEGG 
fenêtré. Les largeurs des fenêtres peuvent être fixées a priori. Pour que l’estimation soit opti¬ 
male, nous avons fixé cette largeur de fenêtre à 3 fois la fréquence fondamentale, qui était donc 
préalablement estimée. 

Comme nous l’avons vu en section 5.4, il existe des zones du phonétogramme pour lesquelles 
l’électroglottographe ne détecte pas de contact glottique. Dans ces zones, le quotient ouvert 
calculé n’a pas été pris en considération dans les calculs qui sont présentés. 


6.3.2 Quotient ouvert, voyelles, mécanismes laryngés : résultats 

La figure 6.10 présente une comparaison des valeurs de quotients ouvert mesurés sur les 
voyelles /i/ et /a/, en Ml et en M2, et pour chaque chanteur. En mécanisme Ml, nous pouvons 
constater que vingt des vingt-et-une valeurs médianes sont situées en dessous de zéro. Cela 
signifie que lorsque l’on compare le quotient ouvert observé entre les voyelles /a/ et /i/ à hauteur 
et intensité donnée, le quotient ouvert est plus grand sur la voyelle /a/ que sur le /i/. De plus 
la différence observée est assez importante, elle est proche de 0.1 pour plusieurs chanteurs, ce 
qui représente 10% de la plage de variation totale du quotient ouvert. En mécanisme M2, nous 
observons une tendance similaire, mais moins prononcée : cinq chanteurs ont une valeur médiane 
positive, et seul B2 a une valeur médiane inférieure à -0.05. Le tableau 6.5 présente les valeurs 
de différences de quotient ouverts moyens sur l’ensemble des 21 chanteurs. Ce tableau confirme 
la tendance observée, à savoir que le Oq serait plus faible en Ml sur /i/ que sur /a/, et que 
cette tendance serait moindre en M2. Les figures 6.11 et 6.12 nous permettent d’introduire les 
quotients ouverts mesurés sur la voyelle /o/. Sur ces deux graphiques, nous constatons que les 
différences de quotient ouvert sont plutôt positives, mais globalement très proches de zéro en Ml 
comme en M2. D’après le tableau 6.5, les différences de quotient ouvert obtenus avec la voyelle 
/o/ sont globalement moins importantes, et inférieures ou très proches des écarts types calculés. 

Nous retiendrons qu’en dépit des variabilités mesurées entre les chanteurs, le quotient ouvert 
est globalement plus faible sur /i/ que sur /a/ en Ml et qu’il n’y a pas de tendance claire se 
dégageant en M2. 
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Fig. 6.10 - Différence de quotient ouvert mesuré entre les voyelles /i/ et /a/ (Oq(/i/) — 
Oq(/a/)), à hauteur et intensité fixées, pour chaque chanteur. Valeurs médianes (traits rouges), 
quartiles (boîtes bleues), valeurs supérieures et inférieures adjacentes (moustaches noires), et 
points «aberrants» (donc situés hors des limites fixées par les valeurs supérieures et inférieures 
adjacentes) (croix rouges). 



Fig. 6.11 - Différence de quotient ouvert mesuré entre les voyelles /a/ et /o/ (Oq(/a/) — 
Oq(/o/)), à hauteur et intensité fixées, pour chaque chanteur. Valeurs médianes (traits rouges), 
quartiles (boîtes bleues), valeurs supérieures et inférieures adjacentes (moustaches noires), et 
points «aberrants» (donc situés hors des limites fixées par les valeurs supérieures et inférieures 
adjacentes) (croix rouges). 
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SI S2 S3 S4 MS1MS2MS3MS4CT1CT2 Tl T2 T3 T4 Bar1BaÆaræar4 B1 B2 B3 

Fig. 6.12 - Différence de quotient ouvert mesuré entre les voyelles /o/ et /i/ (Oq(/o/)—Oq(/i/)), 
à hauteur et intensité fixées, pour chaque chanteur. Valeurs médianes (traits rouges), quartiles 
(boîtes bleues), valeurs supérieures et inférieures adjacentes (moustaches noires), et points «aber¬ 
rants» (donc situés hors des limites fixées par les valeurs supérieures et inférieures adjacentes) 
(croix rouges). 



Moyennes 

Écarts types 

Oq(/i/)-Oq(/a/) 

Ml 

-0.053 

0.038 

M2 

-0.017 

0.024 

Oq(/a/)-Oq(/o/) 

Ml 

0.012 

0.021 

M2 

0.007 

0.022 

Oq(/o/)-Oq(/i/) 

Ml 

0.027 

0.025 

M2 

0.010 

0.017 


Tab. 6.5 - Valeurs moyennes et écarts types des différences de quotients ouverts médians (pré¬ 
sentés figures 6.10, 6.11 et 6.12), mesurées entre deux voyelles (à savoir /i/ et /a/, /a/ et /o/, 
et /o/ et / 1 /), à meme hauteur et meme intensité. 
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6.3.3 Discussion des résultats 

Cherchons à comprendre ces différences de quotient ouvert observées entre /i/ et /a/ en Ml, 
et dans une moindre mesure en M2. D’autres comparaisons de quotient ouvert en fonction de la 
voyelle ont déjà été effectuées. Henrich (2001) a étudié l’influence de la voyelle sur le quotient 
ouvert sur 18 sujets chanteurs, et a trouvé un quotient ouvert légèrement plus grand sur /a/ 
que sur /e/ et que sur /u/ en Ml, ainsi que en M2 de façon non significative (statistiquement). 
Ce résultat est très proche du nôtre. 

Nous savons que le quotient ouvert est habituellement corrélé à l’intensité en Ml et pas en 
M2. Par ailleurs l’intensité est un paramètre du son rayonné, alors que le quotient ouvert est un 
paramètre glottique; la relation physique n’est donc pas immédiate et est susceptible de varier 
en fonction de la voyelle. En termes de fonctionnement glottique, il semble pertinent de chercher 
des corrélations entre le quotient ouvert et un (ou plusieurs) paramètre(s) glottique(s). 

Pression sous-glottique et intensité 

De nombreuses études se sont intéressées aux variations de pression sous-glottique. Ce para¬ 
mètre est connu pour avoir une incidence directe sur le fonctionnement glottique, et pour être 
assez fortement lié à la notion d’intensité vocale (Sundberg, 1987; Sundberg et al ., 1999, 1993; 
Stone et al ., 2003; Titze, 1992, 1994), la pression étant habituellement estimée à partir de la 
pression intra-orale. Sundberg et al. (1999) ont ainsi suggéré qu’un doublement de pression sous- 
glottique causerait une augmentation de 9.9 dB de l’intensité. Sundberg et al. (1993) avaient 
trouvé 11.1 dB, en précisant qu’il s’agit de valeurs moyennes cachant une grande variabilité 
des comportements entre sujets. D’ailleurs, Plant et Younger (2000) ont étudié la variation de 
pression sous-glottique (par mesure directe) chez 9 hommes non-chanteurs, à la fois en fonction 
de la hauteur et de l’intensité (donc dans un plan phonétographique). Ils ont aussi globalement 
relevé cette corrélation entre intensité et pression sous-glottique chez leurs sujets. Il est intéres¬ 
sant de remarquer que ces études sont basées sur des observations effectuées sur des hommes, 
donc utilisateurs du mécanisme Ml. Stone et al. (2003) ont travaillé avec un sujet féminin, mais 
se sont limités à des productions de registre modal (donc probablement utilisant le mécanisme 
Ml). Sundberg et Hôgset (2001) ont étudié les pressions sous-glottiques utilisées par des ténors 
(chantant habituellement en Ml) et des contre-ténors (pouvant donc utiliser les mécanismes Ml 
et M2). Ils ont montré que pour leurs sujets, les pressions sous-glottiques étaient plus faibles 
en registre «falsetto» qu’en registre «modal» (donc vraisemblablement en M2 qu’en Ml), et 
que, dans un cas comme dans l’autre, elles augmentent avec l’intensité. Sa mesure a aussi été 
indirecte, et la voyelle étudiée est le /ae/. Concernant le mécanisme M2, Tom et Titze (2001) 
ont mesuré la pression sous-glottique et le quotient ouvert chez un contre-ténor. Ils ont observé, 
en mécanisme M2 (dénommé registre falsetto par les auteurs) que la pression sous-glottique 
était responsable de plus de 90 % des variations d’intensité et que le quotient ouvert restait très 
constant. Retenons donc que le quotient ouvert est inversement corrélé à l’intensité ainsi qu’à la 
pression sous-glottique en mécanisme Ml, mais que seule la pression sous-glottique est corrélée 
à l’intensité en M2. 

Relations entre la pression sous-glottique, le quotient ouvert, les voyelles et les 
mécanismes 

Quant aux relations entre voyelles et pression sous-glottique, Bucella et al. (2000) ont mesuré 
sur de la parole (donc vraisemblablement en mécanisme Ml) les pressions sous glottiques usuelles, 
et ont trouvé des valeurs supérieures sur /i/ à celles sur /a/. Randi (2008) a mesuré directement 
la pression sous-glottique d’un contre-ténor en Ml et en M2, sur plusieurs voyelles (dont /a/ et 
/i/), ainsi que le quotient ouvert. Elle constate également des valeurs plus faibles de pression sous- 
glottique sur /a/ que sur /i/ pour des valeurs de quotient ouvert identiques sur des productions 
fortissimo de Ml. 

En mécanisme Ml et à intensité fixée, d’après Randi (2008), l’appareil vocal nécessite donc 
une pression sous-glottique plus importante sur /i/ que sur /a/. Cela permet, pour une pression 
donnée, d’obtenir des productions plus fortes sur /a/ que sur /i/. Dans notre étude phonéto- 
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graphique, nous avons effectivement observé des différences d’intensité maximales sur /i/ et sur 
/a/. Correspondent-elles à une même pression sous-glottique? Nous ne pouvons pas répondre 
dans l’absolu dans la mesure où nous n’avons pas mesuré la pression sous-glottique, mais nous 
avons étudié le quotient ouvert qui, en mécanisme Ml, serait corrélé à la pression sous-glottique. 
Nous avons donc étudié les valeurs de quotient ouvert observées sur les limites supérieures des 
phonétogrammes de Ml, sur /a/ et sur /i/. Les résultats sont présentés figure 6.13. Nous ob¬ 
servons que la différence de quotient ouvert, sur la limite supérieure, entre /a/ et /i/ est très 
faible sur toute la tessiture étudiée, ce qui tend à renforcer l’hypothèse que nous avons proposée. 
La différence de limites supérieure, en Ml, serait alors simplement due au fait que pour une 
pression sous-glottique donnée, le /i/ rayonne moins d’énergie que le /a/ du fait des différences 
de fréquences formantiques. 



Fig. 6.13 - Différence de quotient ouvert (Oq(/a/) - Oq(/i/)) mesurée sur les limites supérieures 
des phonétogrammes de Ml. Les résultats obtenus chez les hommes et chez les femmes sont 
présentés séparément. 


En mécanisme M2, Randi a mesuré des pressions identiques avec des quotients ouvert iden¬ 
tiques sur /i/ et /a/. Nous avons observé des quotients ouvert proches sur ces deux voyelles 
en M2, ainsi que des limites supérieures de phonétogrammes identiques. Ce constat semble tra¬ 
duire le fait que les corrélations entre pression sous-glottique, intensité et quotient ouvert ne 
sont pas les mêmes qu’en Ml. Néanmoins nous manquons de données sur le fonctionnement du 
mécanisme M2 pour avancer une hypothèse explicative plus argumentée. 

Il semble alors cohérent de chercher à comprendre si les différences de quotient ouvert que 
nous avons constatées en Ml et pas (ou dans une moindre mesure) en M2 permettent d’expliquer 
les différences sur les limites supérieures des phonétogrammes. 

6.4 Liens entre le quotient ouvert et les limites des phonéto¬ 
grammes 

Nous savons que le quotient ouvert est corrélé à la différence d’énergie des deux premières 
harmoniques de l’onde de débit glottique (le résultat est avéré sur des signaux de parole, cf. 
Hanson, 1997; Fant, 1995). En conséquence, le quotient ouvert est hé au niveau SPL. En M2, le 
quotient ouvert est plus grand qu’en Ml, ce qui se traduit au niveau spectral par plus d’énergie 
dans le premier harmonique que dans le deuxième, alors que c’est l’inverse en Ml. Nous avons 
cherché à savoir dans quelle mesure la différence de quotient ouvert entre les mécanismes Ml 
et M2 pourrait expliquer les différences d’influence de la voyelle sur les limites supérieures des 
phonétogrammes en mécanismes Ml et M2. 

Dans le cadre de la théorie source-filtre linéaire, nous pouvons écrire : 
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S M i(f) = Ugi(f).Vi(f).Li(f) 

S M 2 (f) = Ug 2 (f).V 2 (f).L 2 (f) 

où, dans le mécanisme laryngé Mi, ( i = 1 ou 2 ), SMi(f) correspond au spectre du signal 
vocal rayonné, Ugi à celui du signal de source, Vi au filtre du conduit vocal et Li au rayonnement 
aux lèvres. Si l’on fait l’hypothèse que les filtres ainsi que le rayonnement aux lèvres sont les 
mêmes en Ml et en M2, c’est à dire si V\ (/) = V 2 (/) = V(f) et L\(f) = L 2 (f ) = L(f), on 
obtient : 


SM2U) = 


U92{f) 

Ugi(f) ' 


U 9l (f).V(f).L(f) 


U92U) 

UgiU)' 


Sui(f) 


donc la connaissance de Ugi et de Ug 2 permettrait de reconstruire le signal de M2 à partir 
de celui de Ml. 

Notre but étant de tester l’effet de la différence de quotient ouvert entre Ml et M2 sur le 
SPL, nous avons mesuré le quotient ouvert sur les limites supérieures des phonétogrammes en 
Ml et en M2, pour les trois voyelles séparément, pour chaque chanteur et sur chaque note. Nous 
avons ensuite utilisé ces valeurs mesurées de quotient ouvert et de fréquence fondamentale pour 
simuler, dans chacun de ces cas, les spectres Ug\ et Ug 2 en utilisant un modèle LF (Fant et al., 
1985). Mis à part le quotient ouvert et la fréquence fondamentale, les autres paramètres ont 
été fixés arbitrairement (a m = 0.65, E — 1, TL — 3 dB ; pour un développement plus ample, 
le lecteur peut se référer à Doval et al., 2006). Ensuite, le filtre synthétique dont la réponse 
en fréquence correspond à Ug 2 (f)/Ugi(f) a été appliqué à S mi pour obtenir le signal simulé 
S M2,sim') correspondant au signal S mi dont seul le quotient ouvert a été modifié. 


Hommes 


Femmes 



Fig. 6.14 - Différence des limites supérieures des phonétogrammes obtenues sur /a/ et /i/ 
(SPL(/a /) — SPL(/i/)), en Ml et en M2 (traits pleins), et par modification de quotient ouvert 
à partir des données du mécanisme Ml (traits pointillés). Le test statistique présenté porte sur la 
différence entre la courbe de M2 mesurée et celle simulée (Détails des tests en annexe A, tableau 
A.12 p. 164). 

Nous avons ensuite mesuré pour chaque production le SPL des signaux SM2,sim • La figure 6.14 
présente, pour Ml, pour M2 et pour le résultat de la simulation, les différences moyennes de SPL 
mesurées pour chaque note entre les productions sur /a/ et celles sur /i/. Comme nous l’avons 
déjà vu, ces valeurs sont proches de 10 dB en Ml et de 0 dB en M2, pour les hommes comme 
pour les femmes. La courbe obtenue par simulation est tracée en pointillés. Nous constatons que 
la modification de quotient ouvert diminue fortement la différence d’intensité. La différence entre 
la limite de M2 simulée et celle mesurée ne reste statistiquement significative pour les femmes 
que sur deux notes, et pour les hommes que sur une. Nous pouvons en conclure que d’après 
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ce modèle, la différence de quotient ouvert entre Ml et M2 explique une part importante de la 
différence d’influence de la voyelle sur les limites supérieures des phonétogrammes de Ml et de 
M2. D’autres facteurs peuvent intervenir pour expliquer la différence résiduelle: soit un autre 
paramètre de source varie en fonction des mécanismes laryngés et a une influence sur le SPL, soit 
le modèle source-filtre linéaire est insuffisant et il faudrait prendre en compte les non-linéarités 
dans le couplage entre la source et le filtre pour expliquer le phénomène observé. 

6.5 Bilan du chapitre 

Nous avons étudié les variations de l’amplitude du signal EGG (décrivant la surface de 
contact maximale des cordes vocales au cours du cycle glottique), de la position verticale du 
larynx et du quotient ouvert avec l’intensité, la hauteur, le mécanisme laryngé et la voyelle. 
Nous nous sommes basé sur la présentation de phonétogrammes de ces trois paramètres pour 
comparer l’incidence de la voyelle sur ces paramètres en Ml et en M2. Un résultat est commun 
aux études des trois paramètres, il s’agit de la grande variabilité inter-sujet. Néanmoins nous 
avons pu observer les tendances suivantes : 

Amplitude de l’EGG, position verticale du larynx 

L’amplitude de l’EGG : 

- augmente avec l’intensité en M2, ainsi qu’en Ml dans une moindre mesure. 

- a tendance à diminuer avec la hauteur, mais les coefficients de corrélations sont moins forts 
(en valeur absolue). 

- est plus grande en Ml qu’en M2 à hauteur et intensité données. 

- a tendance à être plus grande sur /i/ que sur /a/, dans les deux mécanismes laryngés. 

La position verticale du larynx : 

- ne présente pas de tendance générale en fonction de la hauteur ou de l’intensité. 

- tend à être plus basse en M2 qu’en Ml, chez les chanteurs de M2. 

- est plus basse sur /i/ que sur /a/ en M2 chez les chanteurs de M2, et en Ml pour les 
chanteurs de Ml. 

Physiologiquement, cette influence de la voyelle peut être due au lien entre la position de la 
langue et le larynx via l’os hyoïde. 

Quotient ouvert et explication de l’influence de la voyelle sur les limites des phoné¬ 
togrammes 

Le quotient ouvert, comparé à hauteur et intensité fixes, est plus faible sur /i/ que sur /a/ en 
Ml, mais pas en M2. 

La différence de quotient ouvert observée en Ml pourrait être due à la nécessité d’une 
pression sous-glottique plus importante sur /i/ que sur /a/ pour produire un son de même 
hauteur et intensité, ce qui ne serait pas le cas en M2. De plus, une simulation numérique nous 
a permis d’établir que cette différence de quotient ouvert entre des productions de Ml et de M2, 
expliquait en grande partie la différence d’influence de la voyelle sur les limites supérieures des 
phonétogrammes de Ml et de M2. 
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Troisième partie 

Etude de paramètres spectraux 
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Chapitre 7 


La répartition de l’énergie dans le 
spectre vue dans le phonétogramme 


Nous allons maintenant étudier l’incidence des voyelles sur le spectre sonore, dans les deux 
mécanismes laryngés Ml et M2. 

La voyelle est un élément constitutif du spectre. Les fréquences des deux premiers formants 
sont comprises entre 200 et 2000 Hz environ pour les hommes, et jusqu’à 2400 Hz pour les 
femmes. Au dessus se trouve une région fréquentielle correspondant à la zone de sensibilité 
maximale de l’oreille. Les chanteurs lyriques apprennent à renforcer cette zone de fréquence, qui 
est donc liée à l’entrainement vocal. La bande correspondant aux fréquences plus aiguës encore 
a été peu étudiée, probablement car elle n’entre pas en ligne de compte pour l’intelligibilité de 
la parole et parce qu’elle se situe aux limites des possibilités de modélisation dans le cadre de 
l’acoustique linéaire. Néanmoins l’oreille humaine perçoit les fréquences jusqu’à 20 kHz, donc 
les harmoniques présentes au delà de 5 ou 6 kHz peuvent être perçues par l’homme et peuvent 
donc avoir de l’importance dans la perception du timbre de la voix (Ternstrôm, 2008). 

En termes de production vocale, le son rayonné résulte naturellement de la combinaison du 
signal glottique avec le filtrage effectué au niveau des cavités résonantielles. A priori donc, les 
voyelles comme les mécanismes laryngés influencent le spectre sonore. Nous allons voir si la 
voyelle influence de la même façon le spectre en mécanismes Ml et M2. Pour cela, nous allons 
dans un premier temps voir comment décrire le spectre, avant de présenter nos résultats quant 
aux paramètres choisis. 


7.1 Paramètres de description du spectre 

Il existe une grande variété de paramètres pour décrire le spectre sonore. De fait, la répartition 
spectrale de l’énergie est souvent associée au timbre vocal, alors que nous connaissons mal 
les paramètres acoustiques corrélés aux dimensions perceptives permettant de le décrire. Le 
spectre sonore renferme des informations très pertinentes à l’oreille, mais difficile à mesurer ou 
à expliciter en termes de paramètres. Cette remarque vaut pour toutes les problématiques liées 
à la mesure de qualités vocales. 

Un paramètre supposé pertinent pour décrire acoustiquement le timbre de la voix est la pente 
spectrale, qui contrôle la décroissance du spectre en fonction de la fréquence. Fant et al. (1985) 
prédit que cette décroissance est de -6 dB/Oct, ou -12 dB/Oct, en fonction de la fréquence et de 
la valeur du paramètre Q a (défini dans le chapitre 1.1.3). Par rapport aux spectres de signaux 
de parole, ceux observés sur du chant lyrique présentent la singularité d’avoir un renforcement 
spectral très important autour de 3 kHz. Ce renforcement est appelé formant du chanteur. Un 
tel renforcement spectral a aussi été observé dans d’autres types de voix projetées, comme chez 
les acteurs (Nawka et al ., 1997). Nous allons détailler ce que nous savons du formant du chanteur 
et de la pente spectrale, comment ces paramètres sont approchés, et ce que nous savons de leur 
dépendance à la hauteur, à l’intensité, aux mécanismes laryngés et à la voyelle. 
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7.1.1 Le formant du chanteur et la pente spectrale 
Le formant du chanteur 

Le formant du chanteur correspond à un renforcement de l’énergie vers 3 kHz, rencontré 
chez les chanteurs et de façon plus générale chez les personnes devant projeter leur voix (par 
exemple les acteurs, cf. Nawka et al., 1997). Il est connu depuis longtemps dans la littérature 
scientifique comme un corrélât d’une voix entrainée (Bartholomew, 1934; Winckel, 1971, 1973; 
Schultz-Coulon et al. , 1979a; Seidner et al. , 1995; Omori et al. , 1996; Mendes et al. , 2003; Watts 
et al., 2006). Il a été observé chez les hommes, ainsi que chez les altos. Chez les sopranos (dans la 
partie aigüe de la tessiture), il ne serait pas présent (Bartholomew, 1934; Weiss et al., 2001), soit 
parce que les sopranos développent d’autres méthodes acoustiques pour faire émerger leur voix, 
soit parce que du fait d’une fréquence fondamentale très aigüe, il n’y a plus assez d’harmoniques 
dans la bande de fréquences du formant du chanteur pour qu’il soit apparent sur un tracé de 
spectre. Il a également été observé que le centre fréquentiel ainsi que la bande de fréquences 
du formant du chanteur varient avec la tessiture. Le formant du chanteur serait ainsi situé à 
des fréquences plus élevées et serait plus large pour les voix aigües que pour les voix graves 
(Dmitriev et Kiselev, 1979; Seidner et al., 1983; Bloothooft et Plomp, 1986a; Sundberg, 2001; 
Pillot et Quattrocchi, 1996). 

Au niveau physiologique et acoustique, Sundberg (1974) a attribué le formant du chanteur à 
un rapprochement des formants 3, 4 et éventuellement 5, ce qui serait accompli par un élargisse¬ 
ment du pharynx accompagnant l’abaissement du larynx, ramenant le rapport de section entre 
tube épilaryngé et pharynx autours de 1/6. Cette hypothèse a ensuite été confirmée (Titze et 
Story, 1997; Kitamura et al., 2006). Titze et Story (1997) ont également montré que cette mo¬ 
dification de l’extrémité du conduit vocal avait une influence forte sur l’onde de débit glottique. 
Ainsi le formant du chanteur peut difficilement être attribué à la source ou au filtre (seul): la 
séparation de la source et du filtre, dans le cas du chant, semble donc peu réaliste. En termes 
techniques, cette difficulté est manifeste pour effectuer du filtrage inverse: le formant du chanteur 
doit-il être présent dans le filtre ou dans le signal de source? 

Nous allons maintenant voir comment est définie la pente spectrale et nous reviendrons sur 
les difficultés d’analyses du signal de voix chantée. 

La pente spectrale 

La pente spectrale a été beaucoup étudiée, bien qu’il n’existe pas de définition claire et consen¬ 
suelle à son sujet. Elle doit permettre de décrire la décroissance du spectre. Il existe beaucoup 
de questions qui doivent être résolues avant de la définir, telles que: 

- sur quelle bande fréquentielle est-elle définie? Les modèles de signaux, appliqués à la parole, 
la définissent entre 0 et 5 kHz. Dans le chant, si l’on décrit par ailleurs l’émergence du 
formant du chanteur, il n’est pas nécessaire de définir de la sorte la pente spectrale sur le 
son rayonné puisqu’elle décrirait aussi l’émergence du formant du chanteur. 

- sur quel signal la définir? La pente spectrale est souvent estimée sur le son rayonné, or 
plusieurs publications et modèles la considèrent comme un paramètre de source (Childers 
et Lee, 1991; Doval et al., 2006). Dans ces conditions se pose pour nous le problème du 
filtrage inverse, qui n’est pas utilisable sur l’ensemble des données recueillies, et qui ne gère 
pas la question de l’appartenance du formant du chanteur à la source, au filtre, aux deux. 

Les méthodes d’estimations et de modélisations traduisent également cette double difficulté. 
Par exemple, Hanson & collaborateurs (Hanson, 1997; Hanson et Chuang, 1999) ont estimé la 
pente spectrale par la différence d’amplitude du troisième formant avec le premier harmonique. 
Cette méthode d’estimation décrit donc plus l’émergence du formant du chanteur que la pente 
spectrale dans le chant. Sur le signal rayonné, des balances spectrales ont aussi été définies, il 
s’agit de faire le rapport d’énergie présent dans deux bandes fréquentielles. Nous reviendrons sur 
ce point dans la partie 7.1.2. Pour approcher la pente spectrale sur la source, Childers et Lee 
(1991) ont défini le HRF ( Harmonie Richness Factor ), par le rapport de la somme de l’amplitude 
de toutes les harmoniques de rang supérieur à 1, avec l’amplitude du premier harmonique. 
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Ce paramètre doit être défini sur le signal de source, car sur le son rayonné l’amplitude du 
premier harmonique peut varier fortement en fonction de la fréquence du premier formant. 
Enfin, plusieurs auteurs ayant modélisé la source glottique ramènent la pente spectrale à une 
fréquence à partir de laquelle la décroissance du spectre passe de 6 dB/Oct à 12 dB/Oct (Doval 
et al ., 2006). 

Par ailleurs, nous avons vu à propos du formant du chanteur que l’utilisation du filtrage 
inverse pose dans le chant la question de son appartenance à la source ou au filtre (seul), et 
pourrait aussi impliquer une redéfinition de ce qui est appelé pente spectrale. Selon nous, ces 
questions théoriques ne peuvent pas être résolues à partir de concepts définis dans le domaine de 
la parole. Nous avons donc choisi, sans entrer dans des problématiques physiologiques portant 
sur le formant du chanteur ou de la pente spectrale, à les approcher par l’étude de la répartition 
de l’énergie dans le spectre. 

7.1.2 Comment décrire le spectre? 

Nous allons dans un premier temps détailler les méthodes d’estimation de l’amplitude du 
formant du chanteur, avant de voir d’autres méthodes permettant d’approcher plus largement 
la répartition de l’énergie. 


Mesurer l’amplitude du formant du chanteur 

La mesure de l’amplitude du formant du chanteur a été approchée de diverses manières. 
Sundberg (2001) mesure la différence d’amplitude du troisième formant par rapport à celle du 
premier, et compare cette différence à ce qu’elle serait dans le cadre de la parole. Pour cela, 
il prédit l’amplitude du troisième formant, connaissant les caractéristiques des deux premiers 
d’après les équations décrites par Fant (1970). Cette méthode permet de décrire l’émergence du 
formant du chanteur (ou plus précisément du troisième formant) par rapport à ce qu’il serait 
en parole. Nous n’avons pas choisi cette méthode car elle nécessite une identification précise des 
fréquences des trois premiers formants. 

Une autre approche consiste à mesurer le niveau maximal du formant du chanteur. De façon 
générale, ce niveau dépend de l’intensité totale. Pour remédier à cet inconvénient et exprimer 
P «émergence» du formant du chanteur, plusieurs auteurs ont proposé de calculer le niveau maxi¬ 
mal du formant du chanteur, et de le soustraire au niveau maximal des premières harmoniques. 
C’est ce qu’ont fait par exemple Schutte et Miller (1984, 1985) en parlant d’équilibre des réso¬ 
nances (résonance balance). Omori et al. (1996) ont proposé d’étudier la différence de maximum 
spectral entre 2-4 kHz et 0 - 2 kHz, et l’ont appelée Singing Power Ratio (SPR). Ce paramètre 
a ensuite été utilisé par plusieurs auteurs (Pillot, 2004; Amir et al ., 2005; Watts et al., 2006). 
Il est habituellement calculé à partir de spectres à long terme (LTAS). Effectuer ce type de 
spectres sur des productions à hauteur, intensité et voyelle fixées s’avère difficile. La fiabilité de 
la mesure est en effet mise en doute, par exemple quand un alignement d’un harmonique sur 
un formant augmente considérablement l’énergie de cet harmonique sans pour autant modifier 
beaucoup l’énergie globale du formant du chanteur. Nous avons choisi de travailler à partir de 
balances spectrales. 

Mesures de balances spectrales 

D’autres méthodes ont encore été utilisées pour estimer l’amplitude du formant du chanteur. 
Elles sont basées sur l’estimation de l’énergie dans une bande de fréquence déterminée. Un 
résumé (non exhaustif) des utilisations de ce type de méthode est présenté tableau 7.1. Nous 
voyons que ces méthodes consistent à comparer soit l’énergie dans deux bandes fréquentielles 
(les auteurs parlent alors souvent de balance spectrale), soit de comparer l’énergie dans une 
bande à l’énergie totale. Les largeurs de bandes utilisées varient en fonction des auteurs, souvent 
la borne inférieure de la bande étudiée est 2 kHz, et la borne supérieure est 4, 5 ou 6 kHz. Il est 
aussi intéressant de constater que les auteurs leur attribuent différentes qualités: dans certains 
cas, le paramètre en question doit approcher la pente spectrale, d’autres fois il ne décrit que le 
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Études 

Bandes spectrales 
utilisées (en kHz) 

nom du para¬ 
mètre 

donnée visée 

Frpkjaer-Jensen et 

Prytz (1976) 

>1 / 0-1 

a 

qualité vocale 

Pabon et Plomp (1988) 

1.5-5 / 0-1.5 


pente spectrale 

Collyer et al. (2007, 
2009) 

Ferguson et al. (2010) 

2-4 / 0-2 

Spectral Balance 

Energy Ratio 

pente spectrale 

Seidner et al. (1983, 
1995) 

2-5 / SPL 


qualité vocale 

Seidner et al. (1985) 

2-4 / SPL 


qualité vocale 

Ternstrôm et al. (2006) 

2-6 / 0.1-1 

Spectral Balance 


Schultz-Coulon et al. 
(1979a,b) 

2.5-3 / SPL 


formant du chanteur 

Bloothooft et Plomp 
(1984, 1985, 1986a,b) 

niveau de tiers 
d’octave / SPL 




Tab. 7.1 - Définitions des différents paramètres utilisés pour décrire la répartition de Vénergie 
dans le spectre (la liste n’est pas exhaustive). 


formant du chanteur. En outre dans plusieurs cas, les auteurs l’utilisent comme un estimateur 
de la qualité vocale. 




(a) Spectre de voix d’homme 
(Bar4, mécanisme Ml, voyelle /a/, ré3, 90 dB) 


(b) Spectre de voix de femme 
(MS3, mécanisme M2, voyelle /a/, mi3, 80 dB) 


Fig. 7.1 - Exemples d’enveloppes spectrales produites par un homme (figure (a)) et une femme 
(figure (b)), pour lesquelles nous avons fait apparaitre le découpage fréquentiel adopté. 


Méthode adoptée 

Nous avons choisi de décrire le spectre par trois bandes fréquentielles comme indiqué figure 
7.1: pour les hommes, la première bande (nommée FBI pour Frequency Band 1 ) va de 0 à 2 
kHz, la deuxième (FB2) de 2 à 4.5 kHz, et la troisième (FB3) de 4.5 à 10 kHz. Pour les femmes, 
FBI va de 0 à 2.4 kHz, FB2 de 2.4 à 5.4 kHz, FB3 de 5.4 à 12 kHz. Ces bornes fréquentielles ont 
été obtenues en multipliant celles des hommes par 1.2, ce qui nous permet de prendre en compte 
les différences morphologiques et acoustiques entre les hommes et les femmes (Fant, 1966). 
Ainsi, FBI comprend essentiellement des informations relatives aux articulations vocaliques 
(elle comprend les fréquences des deux premiers formants), et FB2 comprend le formant du 
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chanteur lorsqu’il est présent dans le spectre. Nous avons choisi de fixer la limite supérieure de 
FB2 à 4.5 kHz pour les hommes et à 5.4 kHz pour les femmes pour que cette limite coïncide avec 
le minimum spectral attribué aux cavités des sinus piriformes (Dang et Honda, 1997). Enfin, 
FB3 correspond aux hautes fréquences, situées au delà de ce qui est habituellement modélisé, 
et contient également un renforcement spectral (appelé parfois «formant à l’octave», cf. Pillot, 
2004). 

Pour cela, nous avons appliqué aux signaux vocaux préaccentués un banc de filtres (un 
passe-bas et deux passe-bande, de Butterworth, correspondant aux trois bandes décrites), et 
nous avons mesuré le niveau de chacune d’elles. 

Nous savons qu’une variation d’intensité globale s’accompagne également d’une variation de 
répartition de l’énergie dans la globalité du spectre. Ce phénomène est commun à l’ensemble des 
instruments de musiques (Castellengo, 2002), et est une des raisons pour lesquelles un pianissimo 
diffère d’un fortissimo, à la fois par une différence de niveau et de timbre. Nordenberg et Sund- 
berg (2004) ont montré que la variation d’énergie était plus importante (en dB) au niveau des 
fréquences aigües que des graves, c’est-à-dire que le niveau de la bande fréquentielle du formant 
du chanteur change plus vite que celui du son global. Pour prendre en compte ce phénomène, 
nous avons choisi d’étudier le rapport d’énergie de chaque bande par le niveau global. Dans la 
suite de la thèse, ce rapport sera appelé ER (pour Energy Ratio). 

ER(FB,) = , i — 1, 2, 3. 

ER(FBl) ne sera pas étudié dans ce manuscrit. Il est très proche de l’énergie totale et 
n’apporte donc pas beaucoup d’information. Il résulte de cette remarque qu’il est très simi¬ 
laire d’étudier l’énergie d’une bande fréquentielle relativement à l’énergie totale ou relativement 
à l’énergie dans FBI. Par conséquent les études de balances spectrales sont très proches de 
ER(FB2). Le SPR contient également une information similaire, bien que le mode de calcul soit 
un peu plus éloigné. Enfin, FB3 est beaucoup plus faible, contient extrêmement peu d’énergie 
physique, bien que les harmoniques présentes dans cette bande puissent avoir une influence sur le 
timbre global. Nous allons maintenant étudier ER(FB2) et ER(FB3) en fonction de la hauteur, 
de l’intensité, du mécanisme laryngé et de la voyelle. 


Note terminologique 

Nous avons défini le formant du chanteur comme un renforcement de l’énergie dans le spectre 
autour de 3 kHz. L’expression «formant du chanteur» est très contestable pour plusieurs raisons: 

- il ne s’agit pas d’un formant mais, au niveau acoustique, du rapprochement des formants 3, 
4 et éventuellement 5. La terminologie anglophone proposée par Sundberg a d’ailleurs évo¬ 
luée en ce sens, de «singing formant» (Sundberg, 1974) vers «singer’s formant» (Sundberg, 
1995; Sundberg et Hogset, 2001), pour aboutir à «singer’s formant cluster» (Sundberg, 
2003) ou «singer’s résonance cluster» (Lamarche, 2009). 

- comme nous l’avons mentionné, ce renforcement n’est pas propre au chant, il est observé 
dans différents types de voix projetées (acteurs, orateurs). 

- pour un chanteur donné, il désigne un renforcement fréquentiel et non une bande de fré¬ 
quences. Il en résulte que le formant du chanteur peut être présent ou non au niveau d’un 
spectre vocal. Néanmoins la limite précise à partir de laquelle nous pouvons parler de for¬ 
mant du chanteur n’est pas définie précisément, ce qui laisse un certain flou pour parler 
du formant du chanteur si le renforcement est faible. 

Nous n’avons pas l’ambition de préciser la définition de ce que nous appelons formant du 
chanteur. Dans notre étude, nous parlerons parfois de ER(FB2), de rapport d’énergie de FB2 
ou de rapport d’énergie du formant du chanteur. Nous assimilerons ces expressions dans notre 
étude, tout en gardant en mémoire que le formant du chanteur désigne un renforcement spectral 
et non une bande de fréquence. 
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7.2 Étude de l’énergie dans FB2 

7.2.1 État de l’art 

Nous allons présenter l’état des connaissances quant aux influences de l’intensité, du méca¬ 
nisme laryngé, de la voyelle sur le niveau du formant du chanteur. 

Le formant du chanteur et l’intensité 

Le niveau du formant du chanteur est lié à l’énergie totale. Schultz-Coulon et al. (1979b) 
enregistré 24 chanteurs professionnels (13 hommes, 11 femmes) chantant sur la voyelle /a/ des 
productions à 65, 75 et 85 dB (mesurées à un mètre de la bouche des chanteurs, mais le son 
a été enregistré à 30 cm), sur do2, sol2 et do3 pour les hommes, et une octave plus haut pour 
les femmes. Ils montrent que l’énergie de la bande 2.5-3 kHz relativement à l’énergie totale 
augmente avec le SPL. 

Cleveland et Sundberg (1983, 1993) ont mesuré l’énergie du formant du chanteur chez trois 
hommes, et ont également constaté que l’énergie du formant du chanteur augmente plus vite 
que le SPL. 

Bloothooft et Plomp (1984, 1985, 1986a,b) ont enregistré une vaste base de données dans le 
but d’effectuer une analyse spectrale des voyelles chantées, et ont notamment étudié le formant 
du chanteur. Ils ont enregistré 14 chanteurs (7 hommes et 7 femmes) effectuant des productions 
sur neuf voyelles, six fréquences fondamentales (de 98 à 880 Hz), et neuf «modes vocaux» (modes 
of singing), incluant fortissimo et pianissimo. Ils ont entre autres effectué des analyses d’énergie 
par tiers d’octave, et ont étudié le niveau de la bande centrée sur 2.5 ou 3.16 kHz, relativement 
au niveau total. Ils constatent aussi que ce dernier paramètre augmente avec le SPL, et diminue 
avec la fréquence, quelle que soit la voyelle ou la tessiture du chanteur. 

Sundberg (2001) a étudié, chez deux barytons, le niveau au dessus de 2 kHz relativement au 
SPL. Il a constaté, pour trois niveaux de fréquence et deux voyelles (/a/ et /i/), une augmen¬ 
tation de 16.3 dB pour 10 dB-SPL. 

Ferguson et al. (2010) ont mesuré toutes les 10 ms la différence d’énergie des bandes 2-4 
kHz et 0-2 kHz. Le paramètre obtenu, qu’ils ont appelé STER (Short Term Energy Ratio), est 
étudié en fonction du SPL, ainsi que de l’entrainement vocal. Neuf hommes de différents niveaux 
vocaux ont été enregistrés, chantant le même air. Outre une corrélation positive entre le STER et 
l’intensité, ils constatent que, chez les sujets les plus entraînés, il existe un seuil de «saturation» 
de SPL, au delà duquel le STER cesse d’augmenter, et parfois même, diminue. 

En étudiant des attributs spectraux de la parole en environnement bruyant, Ternstrôm et al. 
(2006) ont également observé et décrit cette saturation. Le paramètre étudié est appelé balance 
spectrale (SB), et est défini comme l’énergie de 2 à 6 kHz relativement à l’énergie de 100 à 1000 
Hz. Cette saturation est observée chez tous les sujets (hommes et femmes), 6 à 8 dB en dessous 
du niveau maximal possible. 

Collyer et al. (2009) ont également étudié les profils de SB:SPL (la balance spectrale étant 
cette fois définie le STER de Ferguson) en fonction de la hauteur. Cinq chanteuses profession¬ 
nelles ont été enregistrées effectuant des messa di voce produits entre mi2 (165 Hz) et mi5 (1319 
Hz), sur la voyelle /a/ uniquement. Un exemple représentatif de l’ensemble de la base de données 
est présenté figure 7.2. Les auteurs ont observé des profils SB:SPL non linéaires, néanmoins la 
saturation de la balance spectrale n’a été observée que dans 3 productions sur 318. Selon les 
auteurs, il serait préférable, pour les chanteurs, de rester en dessous du seuil de saturation. 

Formant du chanteur et voyelles 

Les voyelles sont fortement liées aux fréquences des deux premiers formants situés dans FBI. 
Elles peuvent également avoir une influence sur l’énergie dans FB2. 

Seidner et al. (1983) ont étudié l’énergie dans la bande 2-5 kHz relativement à l’intensité 
totale, pour les voyelles /a/, /i/ et /u/, chez cinq chanteurs (une basse, un baryton, un ténor, 
une alto et une soprano), à forte intensité. Leur étude ne permet pas d’établir de tendance 
générale quant à l’influence de la voyelle. Seidner et al. (1985) ont ensuite effectué une étude 
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SPL (dB @ 30cm) 


Fig. 7.2 - Profils de SB donnés par Collyer et al. (2009), obtenus à partir de messa di voce 
effectuées par une soprano. Chacun des quatre graphique correspond aux données obtenues sur 
un quart de la tessiture totale de la chanteuse (Q1 correspond à la partie la plus grave, Q4 à la 
partie la plus aigüe). 


plus large, avec 90 sujets répartis équitablement dans trois catégories (chanteurs, étudiants en 
chant et non-chanteurs), et ont mesuré l’intensité du formant de la bande 2-4 kHz. Ils observent 
que le niveau du formant du chanteur prend des valeurs très proches sur les voyelles /i/ et /a/, 
mais est plus faible sur le /u/. Ce résultat est globalement partagé par Bloothooft et Plomp 
(1985). Pillot (2004) a observé que le SPR est plus faible sur /u/ que sur /a/, puis que sur /i/. 

Formant du chanteur et mécanismes laryngés 

Très peu d’études portent sur l’énergie du formant du chanteur relativement au mécanisme 
laryngé. Les études effectuées se heurtent, selon nous, aux écueils suivants: 

- les auteurs ne parlent pas de mécanismes laryngés mais de registres 1 ; 

- les auteurs ont effectué la comparaison de l’amplitude du formant du chanteur entre les 
registres modal et falsetto sur des voix d’hommes uniquement. En conséquence ils étudient 
une voix qui est entrainée à chanter en mécanisme Ml et pas en M2, alors que le formant 
du chanteur est fortement dépendant de la technique vocale. 

Schutte et Miller (1984) ont constaté que le SPR est de 4 dB plus faible en registre falsetto 
que dans les autres registres utilisés en concert par le ténor enregistré (Les auteurs ont plus 
précisément étudié le paramètre de résonance balance , correspondant à l’opposé du SPR). La 
mesure a été effectuée à un niveau confortable, mais il n’est pas précisé si ce niveau est le même 
pour les différents registres. Bloothooft et Plomp (1985, 1986a) ont aussi comparé des produc¬ 
tions de registres modal et falsetto masculines, effectuées sur un sol3 (392 Hz). Ils constatent 
que le niveau du formant du chanteur (relativement au SPL) est 5 dB plus faible en falsetto que 
dans le registre modal, alors que le SPL est 9 dB plus faible. 


1. ce qui par ailleurs présente un intérêt certain, mais distinct du nôtre 
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7.2.2 Résultats 

Notre étude de ER(FB2) a pour but de répondre aux questions suivantes : 

- pourquoi Collyer et al. (2009) ont-ils observés ce phénomène de saturation et pas Fergu- 
son et al. (2010), alors que ces deux études portent sur le chant lyrique? La saturation 
spectrale observée est-elle donc spécifique aux hommes dans le chant? Est-elle limitée à 
un mécanisme laryngé? 

- quelle est la dépendance de ER(FB2) avec le mécanisme laryngé? Observe-t-on des niveaux 
similaires de ER(FB2) lorsque l’on les compare à même hauteur et intensité? Quel est 
l’influence de l’entrainement vocal? 

- l’incidence de la voyelle est-elle la même en Ml et en M2? Observe-t-on les mêmes résultats 
que ceux énoncés dans la littérature en comparant les productions à hauteur et intensité 
fixées ? 


Corrélation entre ER(FB2) et l’intensité 

Les figures 7.3 et 7.4 présentent deux profils de ER(FB2) en fonction du SPL, auxquels nous 
avons adjoint les représentations spectrographiques des deux productions, les courbes de SPL et 
d’amplitude de l’EGG et fonction du temps. 

Le profil ER(FB2):SPL de la figure 7.3 présente deux parties distinctes: en dessous de 87 
dB (repères temporels 2 à 3), la relation entre ER(FB2) et le SPL est linéaire et ER(FB2) 
augmente avec l’intensité, c’est à dire que l’énergie de la bande de fréquences du formant du 
chanteur augmente plus vite que l’intensité. Au dessus de 87 dB (des repères 1 à 2) il sature à 
un niveau proche de 0 dB, c’est à dire que l’énergie de FB2 augmente aussi vite que le SPL. 
Ce type de profil correspond à une saturation de ER(FB2), et est similaire à ceux observés par 
Ferguson et al. (2010) ou Ternstrôm et al. (2006). 

Le profil ER(FB2):SPL de la figure 7.4 diffère de l’exemple précédent : dans la zone de non- 
accolement (repères 2 à 4), ER(FB2) diminue linéairement avec l’intensité, puis augmente. Dans 
la partie avec accolement (repères 1 à 2), il est constant à -10 dB. Ce profil est très similaire à 
certains présentés par Collyer et al. (2009), également obtenus à partir de voix de femmes. 

Pour ces deux exemples donc, modéliser la relation entre ER(FB2) et l’intensité linéairement 
ne semble pas pertinent. Nous n’utiliserons donc pas le coefficient de corrélation comme dans le 
chapitre 6. 

Nous avons présenté figure 7.5 les graphiques représentant les zones explorées par six chan¬ 
teurs dans le plan ER(FB2)-SPL. Les contours présentés sont comparables à ceux des nuages de 
points présentés figure 7.2. Parmi ces chanteurs, S2 est amateur de niveau avancé, et MS2 est 
chanteuse de gospel, les quatre autres chanteurs sont des professionnels. 

Tl est le chanteur qui a le plus de dynamique (SPL) pour un ER(FB2) pratiquement nul. 
Cette tendance se retrouve, à un moindre niveau, chez MS2. Par exemple, elle ne se retrouve pas 
chez CTI pour qui, même en mécanisme Ml, ER(FB2) semble augmenter plus progressivement 
avec le SPL. Cette différence est intéressante à noter, sachant que ces deux chanteurs utilisent 
leur mécanisme Ml de façon très différente: alors que Tl cherche à l’étendre dans l’aigu, et 
peut être à garder un timbre de voix faisant clairement penser à du mécanisme Ml, CTI au 
contraire tend plutôt à ne pas l’étendre dans l’aigu et à trouver un timbre se rapprochant de celui 
du mécanisme M2. Il pourrait y avoir une corrélation entre ER(FB2) et le type de technique 
vocale. Chez B3 nous observons un phénomène tout à fait particulier : à très haut SPL, ER(FB2) 
diminue, c’est à dire que le niveau du formant du chanteur augmente moins vite que l’intensité. 
Si nous observons son phonétogramme complet, nous constatons que cela est dû au fait que 
B3 atteint les plus fortes intensités sur le do3 et au dessus, alors qu’il atteint son maximum 
de ER(FB2) en dessous de do3 (dans une tessiture peut-être plus couramment utilisée), à des 
intensités (SPL) effectivement plus faibles. 

La comparaison des résultats en Ml et en M2 montre que pour la plupart des chanteurs 
présentés ici, des niveaux équivalents de ER(FB2) sont atteignables en Ml et en M2 à intensité 
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dB SPL temps [s] 


Fig. 7.3 - Exemple de profil ER(FB2):SPL produit par Tl en mécanisme Ml, auquel nous 
avons associé le spectrogramme de la production, la courbe de SPL et T amplitude du signal 
EGG. Voyelle: /a/, note: réS (exemple sonore 7). 
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dB SPL temps [s] 

Fig. 7.4 - Exemple de profil ER(FB2):SPL produit par S3 en mécanisme M2, auquel nous avons 
associé le spectrogramme de la production, la courbe de SPL et T amplitude du signal EGG. 
Voyelle: /a/, note: sibS (exemple sonore 8). 
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Fig. 7.5 - Exemples de zones utilisées par les chanteurs dans le domaine ER(FB2) - SPL, pour 
six chanteurs, en Ml et en M2, et sur la voyelle /a/. 
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donnée (mais pas intensité et hauteur). Seul Tl n’atteint pas ses plus hautes valeurs de ER(FB2) 
en M2, ainsi que MS4 à plus de 90 dB. 

Nous avons effectué une observation de profils ER(FB2):SPL, à différentes hauteurs, sur 
l’ensemble de la base de données. Il en ressort que le type de profil présenté figure 7.3 (exemple 
de Tl) a été observé, sur la voyelle /a/, en mécanisme Ml, chez Barl, Bar2, Bar4, B2 (surtout 
dans le grave), B3, Tl et T2, mais pas en mécanisme M2. Nous pouvons remarquer que ces six 
chanteurs utilisent le mécanisme Ml en représentation et pas le M2. 



Fig. 7.6 - Production d’un decrescendo en mécanisme M2 sur /i/, présentant la saturation de 
ER(FB2). Chanteur: MS3, note: miS (Exemple sonore 9). 

Sur la voyelle /i/, nous avons observé ce type de profil chez presque tous les chanteurs en 
mécanisme Ml. Seuls CT2, MS2, SI et S4 (soit quatre chanteurs amateurs) ne manifestent pas 
cette tendance en Ml, soit dans le mécanisme peu ou pas utilisé en représentation. Bl, B2, B3 
et Bar3 ne l’ont que dans la partie grave de la tessiture étudiée. Enfin, T4, CTI, MS3, MS4, S3 
et S2 ont aussi ce type de relation ER(FB2)-SPL en mécanisme M2. Parmi ces chanteurs, seul 
T4 ne chante habituellement pas en mécanisme M2, et les autres sont tous professionnels, ou 
de niveau vocal très avancé. Un exemple de saturation observé en mécanisme M2, sur la voyelle 
/i/, est présenté figure 7.6. 

Pour conclure, nous retiendrons que les profils ER(FB2):SPL varient beaucoup en fonction de 
l’entrainement vocal et de la voyelle. Nous observons globalement une augmentation de ER(FB2) 
avec l’intensité. Les chanteurs de mécanisme Ml développent un phénomène de saturation de 
ER(FB2) dans la tessiture qu’ils utilisent préférentiellement sur la voyelle /a/. L’ensemble des 
chanteurs entrainés le développent sur la voyelle /i/ en Ml, et les chanteurs avancés vocalement 
qui utilisent le mécanisme M2 le développent également en M2 (dans la tessiture étudiée). 
Dans les zones de non accolement des cordes vocales, la relation entre ER(FB2) et le SPL est 
complexe. Elle peut soit correspondre à une pente négative (c’est à dire que l’énergie du formant 
du chanteur n’augmente pas alors que le SPL augmente), soit en une pente positive. 


Influence du mécanisme laryngé sur ER(FB2) 

Nous pouvons voir sur la figure 7.5 que les chanteurs étudiés peuvent atteindre des valeurs 
maximales similaires de ER(FB2) en Ml et en M2 (parfois pas sur toute la dynamique). Nous 
allons maintenant comparer ces ER(FB2) à hauteur et intensité fixées. Les résultats généraux 
sont présentés figure 7.7. 

Cette figure détaille les résultats sur les trois voyelles. Sur les trois voyelles confondues, nous 
constatons d’abord une certaine variabilité entre les sujets. Dans la plupart des cas, les valeurs 

































114 CHAPITRE 7. RÉPARTITION D’ENERGIE SPECTRALE ET PHONÉTOGRAMME 


/a/ 


/i/ 


loi 


CM 

CÛ 

LL^ 

ûf 

LU 


q: 

LU 


CM 

CÛ 

LL^ 

CÉ 

LU 



SI S2 S3 S4 MSI MS2 MS3 MS4 CTI CT2 Tl T2 T3 T4 Barl Bar2 Bar3 Bar4 B1 B2 B3 


Fig. 7.7 - Statistiques de la différence de ER(FB2) mesurée entre les productions de mécanisme 
Ml et celles de mécanisme M2 à hauteur et intensité fixées, détaillées pour chaque chanteur et 
chaque voyelle. 


médianes sont positives, ce qui signifie que l’énergie du formant du chanteur a tendance à être 
plus importante en mécanisme Ml qu’en M2. 

Sur la voyelle /a/, nous constatons que les valeurs médianes varient entre 0 et 12 dB environ. 
Nous notons que les chanteurs de mécanisme M2 (donc les femmes et les contre-ténors) présentent 
tous des valeurs proches de zéro, alors que celles des chanteurs de Ml sont plus dispersées. S2 
et MSI ont même une valeur médiane négative. Nous retrouvons une tendance similaire sur la 
voyelle /i/. Sur la voyelle /o/, chez les chanteurs de M2, les intervalles interquartiles sont plus 
grands que sur les autres voyelles, et du même ordre de grandeur que pour les chanteurs de Ml, 
et les valeurs médianes sont plus élevées que sur les autres voyelles. 

Sur les voyelles /a/ et /i/, il semble que les chanteurs de M2 aient une stratégie d’équilibrage 
de l’énergie du formant du chanteur en Ml et M2. Nous illustrons ce phénomène en comparant 
deux enveloppes spectrales produites par MS3 lors de l’enregistrement de son phonétogramme. 
À hauteur et intensité fixées, le niveau du formant du chanteur est bien équivalent en mécanisme 
Ml et en M2. 



Fig. 7.8 - Enveloppes spectrales de deux productions effectuées en mécanisme Ml et en méca¬ 
nisme M2 par MS3 sur /a/, do3 et 85 dB. 
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Influence de la voyelle sur ER(FB2) 



Fig. 7.9 - Différence de ER(FB2) mesuré entre les voyelles /i/ et /a/ (ER{FB2ji/) — 
ER(FB2ja/)), à hauteur et intensité fixées, pour chaque chanteur. Valeurs médianes (traits 
rouges), quartiles (boîtes bleues), valeurs supérieures et inférieures adjacentes (moustaches 
noires), et points «aberrants» (donc situés hors des limites fixées par les valeurs supérieures 
et inférieures adjacentes) (croix rouges). 

Les figures 7.9 et 7.10 présentent les statistiques des différences de ER(FB2) observées entre 
deux voyelles (respectivement /a/ et /i/, ainsi que /o/ et /a/) à hauteur et intensité fixes, en 
Ml et en M2. Les valeurs médianes de différences observées entre /a/ et /i/ vont de 0 à 10 
dB en Ml, elles prennent des valeurs négatives pour trois chanteurs en M2. Entre /a/ et /o/, 
les différences vont de -3 à 8 dB. Nous nous contenterons de noter que d’une façon générale, 
ER(FB2) est plus grand sur /i/ que sur /a/ et plus grand sur /a/ que sur /o/. 


7.2.3 Discussion 
ER(FB2) et intensité 

Comme nous l’avons vu (partie 7.2.1), de nombreuses études ont déjà décrit l’augmentation 
de l’amplitude ou de l’énergie de la bande fréquentielle du formant du chanteur avec l’inten¬ 
sité. Notre étude permet d’établir que les phénomènes de saturation observées par Ternstrôm 
et al. (2006) sur de la parole forcée ( loud speech over noise ) et par Ferguson et al. (2010) sont 
effectivement présents dans le chant, dans certaines conditions que nous pouvons maintenant 
préciser: la saturation est présente sur la voyelle /i/, en mécanisme Ml et en mécanisme M2 
pour les chanteurs qui sont entraînés à chanter en mécanisme M2. Sur la voyelle /a/, elle est 
présente chez les chanteurs de mécanisme Ml, essentiellement dans la tessiture qu’ils utilisent 
principalement. Nous présentons comme exemple les phonétogrammes de Tl, en mécanisme Ml 
seulement, sur lesquels les zones correspondant à la saturation ont été foncées (figure 7.11). 

Toujours sur la voyelle /a/ et en mécanisme M2, même les chanteurs entraînés ne présentent 
pas cette saturation. Nous pouvons donc en déduire que Collyer et al. (2009) n’ont pas observé 
de saturation dans le chant parce qu’ils se sont restreints à une situation ou effectivement, la 
saturation n’est pas présente (à savoir le mécanisme M2 de voix de femmes, plutôt aigu, et 
sur /a/). Globalement certains chanteurs développent cette saturation, qui n’est donc pas en 
contradiction avec l’entrainement vocal, dans d’autres tessitures et sur d’autres voyelles. 
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Fig. 7.10 - Différence de ER(FB2) mesuré entre les voyelles /a/ et /o/ (ER(FB2ja /) — 
ER(FB2jo/)), à hauteur et intensité fixées, pour chaque chanteur. Valeurs médianes (traits 
rouges), quartiles (boîtes bleues), valeurs supérieures et inférieures adjacentes (moustaches 
noires), et points «aberrants» (donc situés hors des limites fixées par les valeurs supérieures 
et inférieures adjacentes) (croix rouges). 



Fig. 7.11 - Phonétogrammes de mécanisme Ml de Tl, présentés séparément pour les trois 
voyelles. Les parties colorées correspondent aux zones où ER(FB2) est «saturé». 
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ER(FB2) et voyelle 

ER(FB2) est plus grand sur /i/ que sur /a/ et sur /a/ que sur /o/. Ce résultat est proche 
de ceux que nous avons décrits précédemment. 

La théorie acoustique de la production vocale (Fant, 1970) permet de comprendre certains 
éléments relatifs à l’influence des voyelles sur l’amplitude du formant du chanteur. Plus le formant 
n se rapproche du formant n+1, plus le niveau du formant n+1 doit augmenter. Si l’on considère 
que le formant du chanteur est constitué des formants 3, 4 et (éventuellement) 5, alors le niveau 
du formant du chanteur est affecté par les fréquences des deux premiers formants. Sur /a/, la 
fréquence des deux premiers formants est plus élevée que sur /o/, ce qui, d’après la théorie de 
Fant, justifie une amplitude du formant du chanteur plus faible sur /o/ que sur /a/. Sur la 
voyelle /i/ le deuxième formant est très aigu (plus de 2 kHz), ce qui tend à augmenter encore 
le niveau du formant du chanteur. Néanmoins le premier formant est plus bas sur /i/ que sur 
/a/, ce qui pourrait peut-être expliquer que certains auteurs n’aient pas trouvé de différence 
d’amplitude du formant du chanteur entre /a/ et /i/. 

Nous avons mis cette théorie à l’épreuve en simulant des filtres dont les fréquences des deux 
premiers formants sont variables, que nous avons convolué à la même source glottique. Chaque 
formant est modélisé par un filtre d’ordre 2. Le premier formant varie de 500 Hz à 900 Hz, le 
deuxième de 400 Hz à 2200 Hz, avec un facteur de qualité constant. Les formants 3, 4 et 5 sont 
fixes à 2500 Hz, 3000 Hz et 3500 Hz, et ont pour largueur de bande 150 Hz, 200 Hz et 250 Hz. 
Pour simuler la source, nous avons utilisé le modèle LF (/o = 220 Hz, E = 1, Oq = 0.5, a m = 
0.6, et TL = 1 dB). Le résultat de la simulation est présenté figure 7.12, dans le plan du triangle 
vocalique. 

H1 H2 H3 



Fig. 7.12 - Représentation, dans le plan F1-F2, des valeurs que prend ER(FB2) (exprimé en 
dB) simulé. Les régions des différentes voyelles sont obtenues à partir des valeurs médianes et 
des écarts types donnés par Calliope (1989). Ces valeurs théoriques ont été obtenues à partir de 
la parole masculine. 

Ce graphique permet de mettre en évidence que dans le cadre de l’acoustique linéaire clas¬ 
sique, et avec une source dont les paramètres ont été réglés pour simuler du mécanisme Ml, nous 
retrouvons les effets des deux premiers formants cités ci-dessus. D’une part, quand Fl s’approche 
d’un harmonique (situé ici à 440 Hz, 660 Hz et 880 Hz), le SPL augmente et ER(FB2) dimi¬ 
nue. L’augmentation de Fl semble jouer un rôle moins important que la variation de F2. Selon 
cette simulation, ER(FB2) doit effectivement être maximal sur /i/, plus faible sur /a/ et encore 
plus faible sur /o/, ce qui sera d’autant plus marqué que le /o/ est fermé. Les différences ob¬ 
tenues entre voyelles sont néanmoins plus importantes que celles mesurées, il semble donc que 
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le modèle ne prenne pas en compte certains ajustements que les chanteurs effectuent, peut-être 
dans un souci d’homogénéité de timbre. Il est également possible que le troisième formant, dont 
la fréquence varie aussi un peu avec la voyelle, puisse expliquer une partie de l’écart entre la 
simulation et les mesures. 


ER(FB2) et mécanisme laryngé 


Nous avons constaté que la différence de formant du chanteur entre les productions de Ml 
et de M2 variait en fonction du sujet. Si certains chanteurs comme Bar2 ou B2 montrent des 
différences très importantes entre le Ml et le M2, les chanteurs de mécanisme M2 sont capables 
d’obtenir un formant du chanteur identique en Ml et en M2 à intensité et hauteur fixées, sur les 
voyelles /a/ et /i/. Nous avons donc montré que l’amplitude du formant du chanteur dépend de 
l’entrainement vocal, mais dans une dimension peu explorée dans la littérature : le type d’entrai¬ 
nement reçu par les différents chanteurs en fonction de leur tessiture. Les chanteurs n’utilisant 
que le mécanisme Ml ont globalement un formant du chanteur beaucoup plus important en Ml 
qu’en M2. 

Les chanteurs de mécanisme M2 qui utilisent le mécanisme Ml pour émettre les notes graves 
de leur tessiture utilisent le registre de voix mixte pour préparer le changement de mécanisme 
ou pour imiter le timbre d’une production d’un mécanisme en chantant dans l’autre (cf. partie 
1.2.3). Castellengo et collaborateurs (Castellengo et al ., 2007; Lamesch et al ., 2007) ont montré 
en comparant des spectres de productions de mécanisme Ml, registre de poitrine et registre 
mixte, et de mécanisme M2, registre de mixte et registre de tête/falsetto, que les chanteurs 
utilisant la voix mixte étaient capables d’égaliser l’énergie de la zone FB2. Ils ont travaillé sur 
les voyelles /a/ et /i/. Nos résultats sont donc cohérents avec les leurs. 

Il reste à comprendre pourquoi nous avons obtenu des différences d’énergie du formant du 
chanteur sur la voyelle /o/ chez tous les chanteurs. Nous avons présenté figure 7.13 à titre 
d’exemple les phonétogrammes de ER(FB2) obtenus chez MS4, en Ml et en M2, sur les trois 
voyelles. En mécanisme M2, sur /a/ et /i/, nous constatons que la chanteuse est capable de 
maintenir un haut niveau de ER(FB2) dans la partie grave (en dessous du do3), bien que ce 
niveau ne soit pas le même sur /a/ et sur /i/. Sur la voyelle /o/, nous constatons que ER(FB2) 
diminue environ de 7 dB quand MS4 passe du do3 au sib2, alors que nous n’observons pas cette 
diminution en mécanisme Ml sur la même voyelle. Nous avons observé les phonétogrammes de 
FB2 des autres chanteurs (ils sont présentés en annexe C). 

Nous avons constaté que de nombreux chanteurs présentaient cette baisse soudaine de ER(FB2) 
dans le grave du mécanisme M2, parfois associé à une diminution de la limite supérieure. Les 
notes sur lesquelles nous observons ces variations ainsi que les variations en termes de ER(FB2) 
et SPL sont présentées dans le tableau 7.2. Nous constatons que nous observons ce phénomène 
chez 12 chanteurs. Tous ces chanteurs présentent ce même phénomène sur sib2-do3-ré3, à l’excep¬ 
tion notable des deux contre-ténors pour lesquels cette transition s’effectue plus grave. Parmi les 
chanteurs de mécanisme M2, trois des quatre mezzo-sopranos ne présentent pas cette tendance. 

Pour comprendre ces résultats, notons que le protocole d’enregistrement a certainement 
conduit les chanteurs (notamment ceux qui utilisent les deux mécanismes) à produire des sons 
de mécanisme M2 à des hauteurs sur lesquelles ils ne sont pas habitués à utiliser ce mécanisme. 

Il est probable qu’en représentation, les chanteurs présentant cette discontinuité passent en 
mécanisme Ml au moment de cette diminution de ER(FB2) en mécanisme M2. La zone de 
voix mixte (de mécanisme M2) pourrait donc être plus petite pour certains chanteurs. Il serait 
intéressant de comprendre si cette voyelle, dans le grave du mécanisme M2, induit une difficulté 
supplémentaire pour les chanteurs pour faire émerger le formant du chanteur. 
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Fig. 7.13 - Phonétogrammes de ER(FB2) de MS4, présentés séparément pour chaque mécanisme 
laryngé et pour chaque voyelle. 



Fréquence [kHz] 


Fréquence [kHz] 


(a) Ml 


(b) M2 


Fig. 7.14 - Spectres de decrescendos produits par MS4 sur /a/, mi3, en mécanisme Ml (a, 
exemple sonore 10) et en M2 (b, exemple sonore 11). 
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Chanteur 

Note 

A ER(FB2) 

A SPL 

SI 

FB2 faible 


S2 

do3 / sib2 

- 5 dB 

0 dB 

S3 

ré3 / do3 

- 8 dB 

- 5 dB 

S4 

do3 / sib2 

- 4 dB 

- 4 dB 

MSI 

FB2 faible sur 

tout le M2 - /o/ 

MS2 

FB2 faible sur 

tout le M2 - /o/ 

MS3 

FB2 fort sur tout le M2 - /o/ 

MS4 

do3 / sib2 

- 7 dB 

0 dB 

CTI 

fa#2 - sol#2 

- 4 dB 

- 4 dB 

CT2 

fa#2 - sol#2 

- 10 dB 

0 dB 

Tl 

FB2 sans variation brusque avec fO 

T2 

FB2 très inhomogène 


T3 

FB2 très inhomogène 


T4 

do3 - sib2 

- 4 dB 

- 2 dB 

Barl 

do3 - sib2 

- 5 dB 

- 3 dB 

Bar2 

FB2 faible sur 

tout le M2 - /o/ 

Bar3 

do3 - sib2 

- 8 dB 

- 2 dB 

Bar4 

do3 - sib2 

- 3 dB 

0 dB 

B1 

do3 - sib2 

- 3 dB 

3 dB 

B2 

FB2 faible sur 

tout le M2 - joj 

B3 

do3 - sib2 

- 10 dB 

6 dB 


Tab. 7.2 - Notes sur lesquelles ER(FB2) varie brusquement en mécanisme M2, et intervalle de 
variation de ER(FB2) et S PL, détaillées pour chaque chanteur. 


7.3 Étude de l’énergie dans FB3 

7.3.1 ER(FB3) et intensité 

La figure 7.14 présente deux spectres de decrescendos, produits par MS4 sur la voyelle /a/ 
et sur le mi3. Nous précisons que sur cette voyelle, MS4 ne présente pas de phénomène de 
saturation de ER(FB2). Ces deux figures nous permettent d’étudier, chez cette chanteuse, qui 
est susceptible d’utiliser les deux mécanismes laryngés à cette hauteur, l’évolution du spectre 
en fonction de l’intensité dans les deux mécanismes. Constatons d’abord que MS4 est partie 
de 100 dB en Ml et de 90 dB en M2, ce qui correspond au niveau de limite supérieure de ses 
phonétogrammes en mécanisme Ml comme en M2 (sur cette voyelle). 

Nous constatons : 

- en Ml comme en M2, l’énergie des bandes FB2 et FB3 augmente avec l’intensité. 

- la répartition de l’énergie n’est pas identique en Ml et en M2. En particulier, la largeur de 
bande du formant du chanteur et l’étendue fréquentielle du renforcement situé dans FB3 
(appelé formant à l’octave par Billot, 2004) sont plus grandes en mécanisme Ml qu’en 
M2. 

- la diminution de l’énergie dans FB2 est assez régulière, sauf dans les faibles intensités (le 
niveau reste stable de 75 à 70 dB en Ml, et varie fortement en M2). 

- la diminution de l’énergie de FB3 n’observe pas la même régularité que celle de FB2. Par 
exemple, ER(FB3) varie peu de 85 à 80 dB en Ml (sur cet exemple) alors que ER(FB2) 
varie fortement. 

- la comparaison des deux figures montre une différence importante de l’énergie dans FB3 
entre les productions de Ml et de M2, à hauteur donnée. Cette différence est de l’ordre de 
10 dB. Nous reviendrons sur ce résultat dans la partie 7.3.2. 

La figure 7.15 présente l’évolution du spectre et l’évolution des ER(FB2) et ER(FB3) en 
fonction de l’intensité, au cours d’un decrescendo. Sur la figure de gauche, nous retrouvons le 
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° r 
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65 70 75 80 85 90 95 100 

dB SPL 




Fig. 7.15 - Decrescendo produit par Tl. Voyelle /a/, mi3, mécanisme Ml. La figure de gauche 
présente l’évolution de ER(FB2) et de ER(FB3) en fonction du niveau SPL, et celle de droite 
l’évolution globale du spectre en fonction de l’intensité lors de la production de ce decrescendo 
(exemple sonore 7). 


phénomène de saturation décrit dans la partie 7.2 à propos de ER(FB2), pour les intensités 
supérieures à 85 dB. En partant du fortissimo, le chanteur a commencé par diminuer fortement 
son ER(FB3), alors que ER(FB2) restait constant. À 85 dB et en dessous en revanche, alors 
que le FB(FB2) diminue linéairement, ER(FB3) reste à peu près stable, voire ré-augmente 
(en dessous de 75 dB), ce qui dénote que l’énergie dans FB3 reste constante. Nous pouvons 
également constater sur les spectres qui sont tracés figure 7.15 que le passage en dessous de 90 
dB est marqué par une diminution soudaine et très importante de l’énergie du 4è harmonique 
(aux alentours duquel se trouve le deuxième formant). Sur cet exemple donc, la diminution 
d’intensité est accompagnée d’une diminution de l’énergie, d’abord dans FB3, puis dans FB2. 


7.3.2 ER(FB3) et mécanisme laryngé 




Fig. 7.16 - Statistiques de la différence de ER(FB3), en dB, entre les productions de Ml et celles 
de M2 (ER(FB3,M1) — ER(FB3,M2)), à même hauteur et même intensité. Les résultats sont 
détaillés pour chaque chanteur et chaque voyelle. 
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Tendance générale 

La figure 7.16 présente, pour chaque voyelle séparément, les statistiques sur la différence de 
ER(FB3) entre les mécanismes Ml et M2. Sur la voyelle /a/, 14 chanteurs sur 21 présentent 
une valeur médiane positive, c’est à dire que ces 14 chanteurs présentent dans plus de 50 % de 
leur surface de recouvrement des mécanismes plus d’énergie en Ml qu’en M2 dans FB3. Sur /i/ 
et /o/ ils sont 16 dans cette situation, soit plus de 75 % des chanteurs. Comme nous l’avons 
présenté sur les spectres de la figure 7.14 ainsi que lors d’une étude introductive (Lamesch et 
Doval, 2007), il semble y avoir moins d’énergie dans cette bande en M2 qu’en Ml, même chez les 
chanteurs présentant le même ER(FB2) en Ml et en M2. Nous pouvons donc penser que cette 
différence est liée à la source. 



85 

dBSPL 


(a) Ml 



dBSPL 


(b) M2 


Fig. 7.17 - ER(FB3) et ER(FB2) relevés sur les productions de MS4 sur la voyelle /i/ et sur 
un mi3, en mécanisme Ml (a) et en M2 (b). 


Discussion d’un exemple particulier 

La figure 7.17 présente deux autres exemples de productions (crescendo et decrescendo confon¬ 
dus) effectués par MS4 sur le fa#3. Nous avons choisi de présenter des productions obtenues 
sur la voyelle /i/, pour laquelle, comme nous pouvons le vérifier, MS4 présente la saturation 
de ER(FB2), notamment en Ml. Nous pouvons observer ici deux stratégies différentes en fonc¬ 
tion du mécanisme laryngé quant à ER(FB3). En mécanisme Ml, il diminue quand l’intensité 
augmente de 75 dB à 83 dB, ce qui correspond à la zone d’augmentation linéaire de ER(FB2). 
De 85 à 92 dB, ER(FB3) augmente avec l’intensité alors que ER(FB2) est saturé. Puis au-delà 
de 92 dB, ER(FB3) redescend et présente une variabilité importante. L’évolution ER(FB2) et 
ER(FB3) en mécanisme M2 est très différente : au-delà de 95 dB, alors que ER(FB2) est saturé, 
ER(FB3) diminue fortement. 

Cet exemple laisse donc à penser que, pour cette hauteur, la chanteuse augmente d’abord 
FB2, puis FB3 en mécanisme Ml, alors qu’elle augmente FB2 en mécanisme M2, FB3 n’augmen¬ 
tant pas ou peu. Cet exemple illustre donc une stratégie différenciée d’évolution de la répartition 
de l’énergie dans le spectre en fonction du mécanisme laryngé. 


7.3.3 ER(FB3) et voyelles 

La figure 7.18 présente les différences de ER(FB3) observées, en Ml et en M2, entre les 
voyelles /i/ et /a/. Nous constatons que, dans les deux mécanismes, les différences mesurées 
sont positives, c’est à dire que ER(FB3) est supérieur sur /i/ que sur /a/. Nous retrouvons ainsi 
la tendance observée sur FB2. 
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Fig. 7.18 - Statistiques de la différence de ER(FB3), en dB, entre les productions sur /a/ et 
celles sur /i/(ER(FB3,/i/) — ER(FB3j a/)), à meme hauteur et même intensité, en mécanisme 
Ml (figure de haut) d’une part, et M2 (figure du bas) d’autre part. Les résultats sont détaillés 
pour chaque chanteur. 

7.3.4 Conclusions 

L’étude comparée des productions de Tl et MS4 nous permet de tirer les conclusions sui¬ 
vantes : l’énergie dans la bande FB3 peut varier avec l’intensité. Dans les nuances pianissimo elle 
peut ne pas varier (ce qui se manifeste par un ER(FB3) qui décroît linéairement avec une pente 
de -1 dB/dB), mais elle varie dans les intensités fortes. En mécanisme Ml, chez les deux sujets 
étudiés, l’énergie de cette bande augmente plus vite que le SPL quand le niveau du formant du 
chanteur atteint la saturation. En mécanisme M2, il n’augmente pas nécessairement dans cette 
situation. 

Globalement, l’énergie dans FB3 est plus faible en M2 qu’en Ml, et varie comme FB2 en 
fonction de la voyelle. 

7.4 Bilan du chapitre 

Au cours de ce chapitre, nous avons étudié la répartition de l’énergie dans le spectre en 
fonction de l’intensité, du mécanisme laryngé et de la voyelle. Pour cela nous avons défini trois 
bandes spectrales du grave à l’aigu, appelées FBI, FB2 et FB3, dont les bornes sont 0-2 kHz, 
2-4.5 kHz et 4.5-10 kHz pour les hommes, et 0-2.4 kHz, 2.4-5.4 kHz et 5.4-12 kHz pour les 
femmes. ER(FBi) désigne le rapport entre l’énergie dans la i ierne bande et l’énergie totale. FB2 
correspond à la bande fréquentielle où est situé le formant du chanteur. 

ER(FB2) 

- Globalement, ER(FB2) augmente avec l’intensité. 

- L’augmentation de l’énergie dans FB2 est donc habituellement plus rapide que celle du 
SPL, mais dans certains cas elle devient égale à celle du SPL, voire plus lente. Cette 
situation correspond à un phénomène de saturation de ER(FB2), rencontrée: 

• sur /i/ : chez tous les chanteurs en Ml ; et chez les chanteurs de M2, professionnels, 
en M2. 

• sur /a/ : chez les chanteurs de Ml, professionnels, en Ml et dans la zone fréquentielle 
qu’ils utilisent le plus. 
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- ER(FB2) varie avec la voyelle. Il est le plus grand sur /i/, puis sur /a/, puis sur /o/. Ces 
différences peuvent être expliquées en modélisant les formants par des filtres d’ordre 2. 
Cependant les différences observées sont surestimées par le modèle utilisé. 

- Chez les chanteurs de mécanisme Ml, le formant du chanteur est plus intense en Ml qu’en 
M2. Les chanteurs de M2 ont un formant du chanteur aussi intense en Ml qu’en M2 dans 
la zone de recouvrement des mécanismes, notamment sur les voyelles /i/ et /a/. Sur la 
voyelle /o/, les chanteurs ne parviennent pas à maintenir l’énergie du formant du chanteur 
dans la partie la plus grave de la tessiture du mécanisme M2. 

ER(FB3) 

- La répartition de l’énergie dans le spectre varie en fonction de la hauteur, de l’intensité. 
Différentes tendances ont été observées. 

- À hauteur et intensité fixes, l’énergie dans FB3 est plus faible en M2 qu’en Ml, indépen¬ 
damment de l’entrainement vocal et de la voyelle. 

- ER(FB3) varie en fonction de la voyelle. Il est plus grand sur /i/ que sur /a/, dans les 
deux mécanismes laryngés, comme ER(FB2). 
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Quatrième partie 

Transitions de mécanismes laryngés 
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Chapitre 8 

Théorie et techniques vocales 


Après nous être intéressés à l’influence de la voyelle sur la vibration laryngée par rapport aux 
aspects de dynamique et spectraux, nous allons maintenant nous pencher sur l’influence qu’elle 
peut avoir sur les transitions de mécanismes laryngés. Notre but est de comprendre comment la 
transition de mécanisme est gérée en fonction de la voyelle utilisée. 

Il est possible d’étudier l’ensemble des transitions de mécanismes (M0-M1, M1-M2, M2-M3 et 
inversement). Néanmoins la transition M1-M2 est celle qui est la plus communément travaillée, 
et nous nous focaliserons dessus dans l’ensemble de cette partie. 

Dans un premier temps nous allons décrire le phénomène physique de la transition de mé¬ 
canisme laryngé et comment il est utilisé dans plusieurs traditions musicales. Dans le chapitre 
suivant, nous présenterons les bases de données que nous avons été amenés à enregistrer, avant 
de décrire les résultats que nous en avons tirés. 


8.1 Description du phénomène physique 

Nous avons vu dans la section 1.2 que les mécanismes vibratoires laryngés consistent en dif¬ 
férentes configurations vibratoires laryngées. La transition d’un mécanisme à l’autre est souvent 
effectuée de manière brutale, et peut être marquée par une perte de contrôle de l’appareil vocal. 
Elle peut se manifester par quelques millisecondes de «chaos», au cours desquelles la vibration 
laryngée n’est plus quasi-périodique; par quelques périodes avec perte d’accolement glottique 
ou avec doublement de période ; mais dans de nombreux cas elle est marquée par une variation 
brutale de la fréquence d’oscillation des cordes vocales, que le chanteur s’empresse de corriger 
ou d’adapter ensuite. C’est ce phénomène que nous allons maintenant décrire. 

8.1.1 Exemple de transition M1-M2 

La figure 8.1 correspond à un extrait d’une production du chanteur B3, alors qu’il cherchait 
à effectuer des alternances de mécanismes laryngés en restant sur la même note (mi3, 329 
Hz). À l’instant t = 0, le chanteur est en mécanisme Ml. De t=0.25 s à t = 0.81 s, il est en 
mécanisme M2, puis il revient ensuite en mécanisme Ml. Le paramètre A/o décrit l’intervalle 
du saut de fréquence. Dans le sens M1^M2, la fréquence augmente brutalement. Dans le sens 
M2^M1, c’est l’inverse, elle diminue brutalement. Sur l’exemple présenté ici, nous constatons 
que, conformément au protocole imposé, le chanteur a réajusté la fréquence fondamentale à la 
fréquence cible après chaque transition. Ce réajustement observé après les transitions est ici 
anticipé très légèrement dans le sens M1^M2 par une diminution de la fréquence avant le saut, 
et de façon plus marquée par une augmentation de fréquence précédant la transition M2^M1. 

L’étude du signal EGG ainsi que du quotient ouvert montre une phase transitoire glottique 
effectuée en mécanisme Ml juste avant le déclenchement du saut de fréquence lors de la transition 
M1^M2. Cette phase est marquée par une réduction de l’amplitude du signal EGG ainsi qu’une 
augmentation graduelle du quotient ouvert, de 0.5 à 0.8 sur l’exemple présenté. Il en résulte que 
le temps de perturbation de l’EGG, Aîegg, est supérieur au temps effectif du saut de fréquence 
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Fig. 8.1 - Description des transitions de mécanismes laryngés, à partir d’un exemple produit 
par B2 sur la note mi3, et sur la voyelle /i/. 


A tf 0 . En mécanisme M2, l’amplitude du signal EGG se stabilise à une valeur plus faible qu’en 
mécanisme Ml, ce qui correspond à une surface d’accolement glottique plus faible en M2 qu’en 
Ml (comme nous l’avons vu dans la partie 1.2). Cependant, le quotient ouvert ne s’est pas 
stabilisé sur cet exemple, puisqu’il varie entre 0.8 et 0.7 en M2. Si le chanteur était resté plus 
longtemps en M2, le quotient ouvert se serait probablement stabilisé. Lors de la transition 
M2^M1, l’amplitude du signal EGG varie également. Cette variation est déclenchée au début 
de la transition, et se poursuit (ainsi que la diminution de quotient ouvert) alors que la fréquence 
est déjà stabilisée, il en résulte comme dans le sens M1^M2 que A tEGG est supérieur à A tf 0 . 

Ordre de grandeur 

Les variations d’amplitude du signal EGG lors de transitions sont importantes. Roubeau 
(1993) a estimé que l’amplitude du signal EGG diminuait de 59 % en moyenne pour les hommes 
et de 44% pour les femmes lors de la transition M1^M2, et augmentait de 374 % pour les 
hommes et de 129 % pour les femmes lors d’une transition M2—^Ml. Le lecteur peut se reporter 
à la section 6.1 pour une étude approfondie de l’enveloppe du signal EGG en Ml et en M2. 

La durée du saut de fréquence est extrêmement courte. Roubeau et al. (1987) l’estiment à 
quelques millisecondes, soit un ou deux cycles glottiques. Sur l’exemple que nous avons présenté, 
cette durée est un peu plus grande, de l’ordre de 50 ms dans le sens M2^M1, et de 20 ms dans 
le sens M1^M2. Les temps de réajustement post-transitions sont plus longs, et varient de 40 à 
plus de 120 ms en fonction du protocole d’étude, du sexe du chanteur, du sens de la transition 
étudiée (d’après Roubeau et al. , 1989). 

La fréquence de déclenchement des transitions de mécanismes a également été étudiée. Pour 
cela, la méthode utilisée consiste à demander aux sujets de produire des glissandi ascendant 
et descendant, avec transitions de mécanismes (Roubeau, 1993). Globalement, la transition se 
déclenche dans la zone de recouvrement des mécanismes laryngés, à une hauteur exacte qui 
peut varier selon le sujet. La transition M2^M1 est déclenchée à une hauteur plus grave que 
la hauteur d’arrivée du saut M1^M2, ce qui traduit que le glissando descendant n’est pas le 
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simple symétrique du glissando ascendant. Il y a donc un phénomène d’hystérésis concernant la 
hauteur de déclenchement de la transition. 


8.1.2 Protocoles expérimentaux 

Les différents auteurs s’étant intéressés à l’intervalle du saut (paramètre A/o sur la figure 
8.1) ont mis en place des protocoles expérimentaux parfois très différents. Nous allons présenter 
les principaux, leurs avantages et inconvénients. 

Roubeau (1993) a étudié l’intervalle du saut à travers deux protocoles : d’une part des glis- 
sandi ascendant et descendant, d’autre part des notes tenues. Ce deuxième protocole, suggéré 
par Large et al. (1972), impose au sujet de tenir un son à la même hauteur tout en effectuant 
des alternances Ml - M2. Le sujet se doit donc de corriger aussi vite que possible les sauts de 
fréquence qui se produisent lors des transitions. Ce type de production est a priori assez éloi¬ 
gné de la pratique musicale, quoi qu’il ait été suggéré explicitement par Garcia (1856) dans sa 
méthode de chant (voir figure 8.2). 


EXERCICE SPÉCIAL 
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Fig. 8.2 - Exemple d’exercice proposé par Garcia (1856) dans sa méthode de chant, ayant pour 
but d’unifier les registres de poitrine et de falsetto, que nous associons aux mécanismes Ml et 
M2. 

Svec et Pesak (1994) ont choisi d’étudier la transition M1^M2 en effectuant une augmenta¬ 
tion de débit (les auteurs ne donnent pas plus de détails). Plus tard, Svec et al. (1999) ont fait 
subir à leurs trois sujets un petit entrainement pour les amener à produire des transitions de la 
façon la moins contrôlée possible. Il leur était notamment demandé d’effectuer des alternances 
de mécanismes laryngés (dénommé par chest et falsetto registers dans la publication) sans viser 
d’intervalle particulier entre les deux modes de production. Les auteurs ont néanmoins noté 
que lors des transitions qu’ils ont enregistrées, une légère adaptation de fréquence était observée 
après le saut (comparable à notre période de réajustement) pour faire en sorte que l’intervalle du 
saut corresponde à un intervalle de la gamme. Plus tard, les mêmes auteurs (Miller et al ., 2002) 
ont proposé un protocole plus restrictif pour étudier les sauts de fréquences, qu’ils proposent 
de dénommer characteristic leap interval. Ils donnent en particulier cinq conditions à remplir, 
parmi elles, ils explicitent la nécessité que le changement de mécanisme (les auteurs utilisent le 
mot registre ) soit effectué entre deux hauteurs, mais que la hauteur d’arrivée ne soit pas contrô¬ 
lée par le sujet. Cette dernière doit résulter spontanément des ajustements laryngés consécutifs 
au changement de mécanisme. Concrètement, les auteurs ont demandé à leur sujet de maintenir 
la pression sous-glottique constante (estimée à partir d’une mesure de pression oesophagienne) 
lors des transitions. 

L’idée de Svec & collaborateurs de chercher à maintenir la pression sous-glottique constante 
en n’effectuant la transition que par modification du débit est intéressante, néanmoins le pro¬ 
tocole qu’ils proposent laisse aux sujets la responsabilité de ne pas effectuer d’ajustement de 
fréquence après la transition, ce qui est une tâche difficile compte tenu de l’inexpérience de la 
population (même parmi les chanteurs lyriques) par rapport à ce type de production. De ce 
point de vue, l’idée d’imposer au sujet de revenir à la même note de départ après le saut semble 
être plus valide car elle impose au sujet une consigne claire et permet une mesure fiable de 
l’intervalle du saut. Néanmoins la façon d’effectuer le réajustement n’est pas maîtrisée par le 
protocole. Nous considérons que cet inconvénient n’est pas gênant dans la mesure où nous nous 
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intéressons uniquement à l’intervalle du saut, qui comme nous l’avons vu, se produit dans un 
temps très court, ne laissant pas au sujet le temps d’effectuer de modifications importantes au 
niveau sous-glottique. Nous adopterons donc le protocole des notes tenues à la suite de Roubeau 
(1993) et de Large et al. (1972). 

8.1.3 Modèles descriptifs ou explicatifs 
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Fig. 8.3 - Illustration de la variation de hauteur en fonction de la tension longitudinale appliquée 
par Van den Berg sur un larynx excisé. Adapté de Svec et al. (1999) 

La cause physiologique de ce saut de fréquence est longtemps restée inexpliquée. Comme la 
fréquence de vibration est contrôlée par l’activité des muscles laryngés, une première hypothèse 
consiste à supposer que le saut de fréquence est dû à une modification soudaine de l’activité 
d’au moins un des muscles laryngés. Par rapport à cette hypothèse, Svec et al. (1999) ont décrit 
un phénomène intéressant en se basant sur une vidéo produite par Van den Berg, montrant un 
larynx excisé auquel il applique une tension longitudinale, qu’il fait ensuite varier. Le résultat 
de cette expérience est schématisé figure 8.3. Partant de la tension Ta, et alors que la tension 
longitudinale augmente, la fréquence vibratoire augmente en conséquence. A une certaine tension 
(Te), et alors que l’expérimentateur continue à faire croître linéairement la tension, la fréquence 
saute d’un régime de type Ml (appelé chest par les auteurs, traduit par poitrine sur la figure) à 
un autre régime de type M2 ( falsetto dans l’original). Continuant d’augmenter la tension (jusqu’à 
Td), la fréquence continue à augmenter linéairement. L’expérimentateur fait ensuite décroître 
la tension, provoquant une diminution de la fréquence. A Te, les cordes vocales continuent 
à vibrer sur un régime de type M2, ce n’est qu’à une tension Tb<Tc que la fréquence de 
vibration ressaute à une fréquence inférieure, la vibration glottique redevenant de type Ml. Cette 
expérience montre que pour une même tension des cordes vocales (comprise entre Tb et Te), deux 
configurations vibratoires sont possibles. Cette expérience est en accord avec les observations des 
cycles d’hystérésis que nous avons évoqué à propos des transitions de mécanismes se produisant 
lors de glissandi. 

L’hypothèse de non-linéarité du comportement vibratoire des cordes vocales a été étudiée à 
partir de larynx excisés (Berry et al. , 1996), ou à partir de modèles physiques tels que le modèle 
à deux masses (Lucero, 1993; Steinecke et Herzel, 1995; Lucero, 1996). Un système dynamique 
non-linéaire a pour caractéristique que le paramètre de sortie (la fréquence fondamentale pour 
notre propos) puisse varier de façon non-continue alors que les paramètres d’entrée varient conti¬ 
nûment. Berry et al. (1996) ont ainsi étudié la vibration laryngée sur des larynx canins excisés, 
et ont contrôlé la pression sous-glottique et un paramètre définissant l’asymétrie des cordes vo¬ 
cales. Dans le plan défini par ces deux paramètres, ils ont établi des zones dans lesquelles le 
larynx a une vibration de type Ml, d’autres où il a une vibration de type M2, et des zones 
de recouvrement, le passage d’un type de vibration à l’autre s’effectuant avec une discontinuité 
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de fréquence fondamentale. De plus amples développements sur la théorie des systèmes dyna¬ 
miques non-linéaires appliquée à l’oscillation des cordes vocales sont disponibles aux références 
suivantes: Titze et al. (1993) et Herzel (1995). 

Appliquées aux transitions M1-M2 sur un larynx humain vivant, ces études laissent penser 
qu’il est possible que la fréquence de vibration des cordes vocales varie brutalement alors que 
l’activité des muscles laryngés et la pression sous-glottique varient continûment. D’après Rou- 
beau (1993), les transitions seraient dues à des variations subites de masse vibrante, phénomène 
typiquement produit par le découplage des différentes couches constitutives des cordes vocales 
(pour le sens M1^M2). 

Nous pouvons constater que l’ensemble de ces descriptions ne prennent pas en ligne de 
compte le conduit vocal, et encore moins la voyelle. Cette dernière n’apparait donc pas comme 
un élément moteur de la transition laryngée. Nous allons maintenant quitter pour quelques 
lignes les descriptions physiques de ces transitions pour voir comment les chanteurs se les sont 
appropriées, et si les voyelles ont pour eux une importance vis-à-vis de ces transitions. 


8.2 Transitions M1-M2 et techniques vocales 

Les mécanismes laryngés étant communs à l’ensemble des humains, chaque culture a dû 
apprendre à utiliser d’une façon ou d’une autre les transitions de mécanisme laryngé. Nous allons 
illustrer trois d’entre elles : la musique lyrique occidentale où les transitions sont masquées, les 
musiques traditionnelles utilisant le yodel, et la musique traditionnelle iranienne utilisant le 
tahrir. 


8.2.1 Le chant lyrique: masquer! 

Nous avons vu dans la partie 2 que les chanteurs lyriques professionnels avaient pour objectif 
d’obtenir un timbre homogène sur l’ensemble de leur tessiture. Or l’utilisation des différents 
mécanismes laryngés peut, dans certains cas, être un obstacle à cette homogénéité de timbre. 
Pour remédier à cette difficulté, les chanteurs adoptent habituellement deux stratégies : soit ils 
ne chantent que dans un mécanisme laryngé (comme les basses ou barytons qui n’utilisent que le 
Ml), soit ils utilisent les deux mécanismes, et travaillent à obtenir une transition de mécanisme 
laryngé la moins audible possible. Ce travail concerne essentiellement les contre-ténors et les 
voix de femmes. Le geste vocal nécessaire pour adoucir la transition de mécanisme laryngé peut, 
en fonction du chanteur, être plus ou moins long à acquérir. 



Fig. 8.4 - Illustration de transitions de mécanismes laryngés dans le plan phonétographique. A 
l’intérieur des phonétogrammes de Ml et de M2, les deux lignes correspond à des trajectoires 
suivies par CTI dans la production de deux glissandi ascendants, l’un en masquant le saut de 
fréquence, l’autre en ne le masquant pas. La voyelle utilisée est le /o/. 
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La figure 8.4 présente, dans le plan phonétographique, deux glissandi ascendants effectués 
par CTI. Ce chanteur est entraîné à passer d’un mécanisme à l’autre sans laisser entendre de 
rupture, et est capable de produire sur demande des glissandi avec ou sans saut de fréquence. 
Sur cette figure, nous pouvons nettement constater dans un cas le saut de fréquence d’une tierce 
majeure (4 demi-tons) environ marquant la transition de mécanisme, alors que dans l’autre cas 
nous ne voyons aucun saut de fréquence, la transition de mécanisme étant probablement effec¬ 
tuée au niveau du la2 (cette figure seule ne permet pas de l’affirmer). Nous constatons que pour 
masquer le passage de mécanisme, le chanteur a effectué son glissando dans une nuance beaucoup 
plus piano que dans l’autre cas. Cette technique permettant de lisser la transition de mécanismes 
laryngés a déjà été observée (Roubeau, 1993; Henrich, 2001). Intuitivement, nous pouvons consi¬ 
dérer cette stratégie comme étant parfaitement cohérente, puisque pour effectuer une transition 
sans saut de fréquence, le premier critère est de se placer dans la zone de recouvrement pour 
effectuer cette transition. C’est exactement ce qu’a effectué CTI. 

En pratique, si un chanteur doit effectuer une transition de mécanisme, il l’effectuera dans 
une situation où d’autres facteurs tendent à la masquer, comme un changement de note ou de 
voyelle par exemple. Il est très rare qu’il soit amené à l’effectuer sur une note tenue ou sur un 
glissando comme c’est le cas ici. 

8.2.2 Le yodel : rappel des voyelles utilisées 

Le yodel est une technique vocale tout à fait opposée à la technique lyrique dans la mesure où 
elle cherche à jouer sur le contraste entre les mécanismes Ml et M2 et utilise donc pleinement les 
transitions de mécanismes. Il s’agit d’une musique vocale, sans paroles, polyphonique ou non. Elle 
est connue en Europe pour être caractéristique de la musique populaire suisse et tyrolienne, mais 
nous retrouvons des techniques similaires dans des musiques traditionnelles d’autres continents, 
notamment en Afrique (Fürnifi, 1988, 1991). 



Fig. 8.5 - Exemple de yodel suisse. La courbe de quotient ouvert montre bien une alternance 
entre des valeurs faibles (0.4) et des valeurs élevées (0.7), traduisant l’alternance des mécanismes 
laryngés, notamment dans la période de 4 à 5 secondes de cet extrait (exemple sonore 12). 

La figure 8.5 présente un exemple de yodel suisse. La courbe de quotient ouvert nous permet 
de visualiser clairement les parties produites en mécanisme Ml et celles produites en mécanisme 
M2. 

Lors de sa venue au laboratoire, cette chanteuse de yodel (Barbara Klossner) nous a confié 
que dans le style du yodel suisse, les notes produites en mécanisme Ml étaient chantées sur la 
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voyelle joj (la voyelle tendant à s’ouvrir vers un /a/ quand la chanteuse monte dans l’aigu du 
mécanisme Ml), et les notes en mécanisme M2 sur les voyelles /y/ ou /u/. Selon elle, la voyelle 
j\j n’est pas utilisée dans le yodel suisse, mais l’est dans le yodel tyrolien (toujours pour les 
productions en mécanisme M2). 

Fürnifi (1991) a effectué une revue bibliographique détaillée des voyelles utilisées dans des 
musiques yodlées, extraites de différentes cultures. Ayant étudié le yodel autrichien, alpin, centre- 
africain, gabonais et zaïrois, elle a constaté que les voyelles utilisées en registre grave (que nous 
attribuons au mécanisme Ml) sont les voyelles [e, e, a, o, o] et que celles utilisées en registre aigu 
(mécanisme M2) sont les [i, y, u]. Fürnifi a classé ces voyelles en fonction du degré d’ouverture de 
la mâchoire, et a constaté que les voyelles utilisées en mécanisme M2 correspondaient à celles du 
premier degré d’ouverture (celui pour lequel la mâchoire est la plus fermée), alors que les voyelles 
utilisées en mécanisme Ml correspondent à celles des autres degrés d’ouverture. Acoustiquement, 
ces corrélations doivent se traduire par une fréquence du premier formant très basse (proche de 
la fréquence fondamentale du signal compte tenu de la hauteur à laquelle chantent les chanteurs) 
pour les voyelles utilisées en mécanisme M2, et plus haute pour le mécanisme Ml. 

Ces associations sont intéressantes dans la mesure où elles coïncident avec les observations 
effectuées dans les méthodes de chant ou les questionnaires de chanteurs (cf. partie 2). Elles 
posent également question. Pourquoi toutes ces traditions effectuent-elles les mêmes associations 
entre mécanisme et voyelle? Ces associations sont-elles effectuées pour favoriser le plus possible la 
vibration laryngée dans chacun des mécanismes, ou pour favoriser (ou marquer) la transition? 
Les changements de voyelles permettent-elles de contrôler l’intervalle des sauts? Les études 
présentées dans le chapitre 9 nous permettront de répondre à ces questions. 

8.2.3 Le tahrir : utilisation de la transition comme ornement 

Le tahrir est une technique vocale particulière, apparue selon L. Miller (1999) 1 dans les 
régions indo-européenne, indo-iranienne ou peut être asiatique, et dont la forme la plus élaborée 
se pratique aujourd’hui en Iran et en Azerbaïdjan. D’après During (1984), le tahrir est une 
appoggiature rapide sur une ou plusieurs notes. [...] La note principale est agrémentée d’un 
son appogiaturé, chanté en voix de tète lorsque le son principal est en voix de gorge [...]. Il 
écrit également que les voix de femmes sont autant appréciées que les voix d’hommes , et que 
le timbre lui-même n’est pas un élément essentiel du chant. Ainsi selon cette description, et si 
l’on interprète la description de During en termes de mécanismes laryngés, le tahrir peut être 
compris comme une technique vocale d’ornementation mettant en jeu les mécanismes Ml et 
M2 (c’est en tout cas l’hypothèse qu’avance Castellengo, 1991), ce qui expliquerait qu’elle soit 
accessible aux femmes comme aux hommes (et même aux enfants), et que la finalité musicale 
porterait plus sur l’appoggiature elle-même que sur le timbre de la voix. 

Nous avons cherché à comprendre : 

- si cette ornementation était effectivement produite à l’aide de transitions de mécanismes 
laryngés, 

- quelles voyelles les chanteurs utilisaient. 

Pour cela une collaboration a été mise en place avec J. During, ethnomusicologue. Les pre¬ 
miers résultats des travaux qui en ont résulté ont été présentés à l’occasion de deux conférences 
(Castellengo et al ., 2007, 2009). Cette collaboration nous a notamment permis d’enregistrer 
une chanteuse iranienne (Solmaz Badri) maîtrisant le tahrir. Le matériel d’enregistrement est 
équivalent à celui utilisé pour la base de données de phonétogrammes (cf. section 4.1). 

La figure 8.6 présente un exemple de tahrir produit par la chanteuse venue au laboratoire. 
Les ornements, visibles entre 1 et 2 secondes, correspondent à la technique du tahrir. Il s’agit 
de très courts passages (de l’ordre de 50 ms) caractérisés par un quotient ouvert élevé, et une 
fréquence fondamentale de l’ordre d’une tierce supérieure à celle de la note de départ. La ligne 
mélodique (excepté les ornements) est caractérisée par un quotient ouvert très bas, de l’ordre de 

1. Lloyd Clifton Miller est un ethnomusicologue spécialiste du Moyen-Orient, à ne confondre ni avec Richard 
Miller, ni avec Donald G. Miller 
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Fig. 8.6 - Interprétation d’un chant nécessitant l’utilisation du tahrir. Nous présentons, de haut 
en bas, le spectrogramme, les courbes de SPL, de quotient ouvert, de fréquence vibratoire et 
d’EGG (exemple sonore 13). 


0.4, caractéristique du mécanisme Ml utilisé dans sa partie la plus aigüe, dans une émission 
commune à beaucoup de musiques traditionnelles. Cet ensemble de caractéristiques montre 
effectivement que le tahrir correspond à de très courts emprunts de mécanisme M2 dans un 
chant exécuté en utilisant le mécanisme Ml. Il est intéressant de constater que les variations 
de quotient ouvert sont plus lentes que les sauts de fréquence, ce qui donne même l’impression 
que le quotient ouvert oscille entre deux valeurs (l’une caractéristique du Ml et l’autre du M2), 
confirmant notre observation selon laquelle le signal EGG connait une période d’anticipation 
avant la transition M1^M2, marquée par une diminution de l’enveloppe du signal EGG et une 
augmentation de quotient ouvert, et une augmentation de l’enveloppe EGG et une diminution 
du quotient ouvert après la transition M2^M1. Sur l’exemple présenté, la chanteuse effectue au 
maximum entre 3 et 4 ornements par seconde, mais les chanteurs iraniens peuvent aller jusqu’à 
6, voir 7 ornements par seconde. 

En termes de tessiture, la chanteuse a produit du tahrir pour une ligne mélodique (chantée en 
Ml) entre les sol2 et do4, mais nous avons recueilli des enregistrements de chanteurs (masculins) 
allant jusqu’au mi4 (ce qui est assez rare pour être souligné). 


Tahrir et voyelles 

Compte tenu de la brièveté de l’appoggiature en M2, il est probable que les chanteurs n’aient 
pas le temps de modifier la forme du conduit vocal lors du changement de mécanisme. La 
chanteuse enregistrée au laboratoire utilise essentiellement une voyelle correspondant à un /o/ 
ouvert, qui s’ouvre de plus en plus vers le /a/ quand la chanteuse monte dans l’aigu. C’est cette 
voyelle qui est utilisée sur l’exemple de la figure 8.6, et il est probable que cette modification de 
voyelle soit liée avec une stratégie d’alignement du premier formant avec le deuxième harmonique. 
Outre cette voyelle, la chanteuse utilise également beaucoup le /e/. Il est intéressant de constater 
que ces deux voyelles sont citées par Fürnifi (1991) comme étant aussi utilisées en mécanisme 
Ml pour le yodel. La chanteuse a également effectué des exemples de tahrir sur /i/, /e/ et /u/ 
sur un mib3 à titre d’exemple, mais nous en rencontrons peu sur ces voyelles dans la musique. 
Selon Mozafar Shafi’i, chanteur iranien avec qui s’est entretenu During (2008), le tahrir effectué 
sur la voyelle /i/ est le plus difficile à effectuer, mais aussi est très recherché pour l’effet musical 
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qu’il produit. 


Oq 


(a) Voyelle /a/ 


(b) Voyelle /i/ 




Fig. 8.7 - Deux exemples de tahrir effectués sur mibS, et sur la voyelle /a/ (figure (a), exemple 
sonore 14) et sur la voyelle /i/ (figure (b), exemple sonore 15). 

La figure 8.7 présente deux exemples de tahrir, effectués sur les voyelles /a/ et /i/. Les 
courbes de fréquence fondamentale et de quotient ouvert, associées aux spectrogrammes, per¬ 
mettent d’identifier aisément les ornements. Nous constatons sur ces deux figures que le tahrir se 
traduit par une diminution d’intensité sur /a/ et, à l’opposé, par un renforcement sur /i/. Cette 
observation peut être rapprochée de nos résultats concernant les limites supérieures des phoné- 
togrammes : nous avons vu en partie 5 que la voyelle /a/ permettaient aux chanteurs d’obtenir 
des sons plus intenses en Ml qu’en M2, alors que cette tendance était annulée, voir inversée sur 
le /i/. Le tahrir pourrait être une illustration de ce résultat. 


8.3 Bilan 

Lors d’un changement de mécanisme (Ml—^M2 ou M2^M1), il se produit habituellement un 
saut de fréquence associé à une modification du timbre de la voix. Le saut de fréquence est lié, 
au niveau laryngé, à une modification de la surface de contact des cordes vocales, traduisant une 
modification subite de la masse vibrante, alors que les paramètres de contrôle musculaire (acti¬ 
vités du thyro-aryténoïdien et du crico-thyroïdien) et aérodynamique (pression sous-glottique) 
restent constants ou varient lentement. Ces transitions sont modélisables à l’aide de modèles 
mécaniques non linéaires. L’amplitude du saut de fréquence lors de la transition M1^M2 a été 
étudiée à travers différents protocoles, parfois assez éloignés. 

Ces transitions ont été diversement utilisées. Dans le chant lyrique, les sauts de fréquence 
ou les changements subits et incontrôlés du timbre vocal sont toujours évités. Nous souhaitons 
étudier le rôle la voyelle dans leur stratégie de masquage. La technique du yodel a été obser¬ 
vée dans différentes cultures, elle utilise les transitions de mécanismes laryngés associées à des 
changements de voyelle bien précis. Les voyelles ouvertes sont utilisées en Ml et les voyelles 
fermées en M2. Nous souhaitons comprendre l’importance de ce changement de voyelle pour les 
transitions de mécanismes. La technique persane du tahrir utilise des courts emprunts en M2 au 
milieu d’une mélodie chantée en Ml, comme appoggiature. Elle peut être effectuée sur toutes les 
voyelles, mais elle est plus difficile à produire sur les voyelles fermées, mais aussi plus recherchée. 
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Chapitre 9 

Sauts de fréquence et hauteur 
fondamentale, intensité, voyelle 


Ce chapitre présente l’influence de l’intensité, de la hauteur, de la voyelle sur les sauts de 
fréquence que nous observons lors des transitions de mécanisme laryngé. Nous avons choisi de 
restreindre l’étude à l’intervalle du saut de fréquence ainsi qu’à la fréquence de départ. Pour cela 
nous avons été amenés à enregistrer deux bases de données que nous présenterons en partie 9.1. 
Nous présenterons ensuite les résultats portant sur l’intervalle du saut (partie 9.2), puis ceux 
sur la fréquence de départ du saut (partie 9.3). 


9.1 Constitution des bases de données 

9.1.1 Intervalle du saut 

Le protocole que nous allons maintenant décrire vise à étudier l’intervalle du saut en fonction 
de la hauteur, de l’intensité et de la voyelle. Son enregistrement et son dépouillement ont été 
partiellement effectués à l’occasion d’un mémoire de master (Albert, 2008). 


Nous avons demandé à chaque chanteur sujet de produire des alternances de mécanismes 
laryngés en cherchant à rester sur la même note. Sur un son tenu, il est donc demandé au 
chanteur d’effectuer plusieurs transitions (idéalement au moins deux productions dans le sens 
M1^M2 et deux dans le sens M2^M1 par production). 

Ces productions ont été effectuées dans la zone de recouvrement des mécanismes laryngés. 
Nous avons demandé aux chanteurs d’effectuer ces productions, dans un premier temps sur 
la voyelle /a/, et à une hauteur «confortable» pour ce type de production. Nous avons ensuite 
proposé aux chanteurs d’effectuer des productions similaires en descendant progressivement dans 
le grave (ton par ton, comme pour l’enregistrement des phonétogrammes), puis de même dans 
l’aigu. Sur chaque note, nous demandions aux chanteurs d’effectuer trois ou quatre niveaux 
d’intensité différents (selon les possibilités des chanteurs). Cet exercice était ensuite répété sur 
/i/, puis sur joj (un /o/ fermé comme pour la base de données de phonétogrammes). 


Sept chanteurs ont participé à cette étude, il s’agit de SI, S3, S4, MS2, T3, Barl, B3. Nous 
avons donc enregistré quatre femmes, supposées avoir une certaine maîtrise de la transition 
de mécanisme (dans la stratégie de masquage) et trois hommes (n’ayant pas de pratique du 
mécanisme M2, donc de la transition). Néanmoins si nous comparons le niveau d’expertise de 
ces chanteurs à celui de chanteurs de yodel maîtrisant parfaitement les intervalles des transitions 
de mécanisme, nous pouvons considérer que ces sept chanteurs ne sont pas entrainés pour la tâche 
qui leur a été demandée. Remarquons également que ces sept chanteurs avaient préalablement 
passé le protocole d’enregistrement des phonétogrammes. 
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Fig. 9.1 - Exemple de production demandée dans le protocole d’enregistrement. Le changement 
de mécanisme est attesté clairement par le changement d’amplitude du signal EGG ainsi que 
le changement de quotient ouvert. La transition de mécanisme est marquée par une perte de 
contrôle de la fréquence fondamentale. Chanteur: B3, fa#3, voyelle /a/ (exemple sonore 16). 


Le dispositif expérimental est identique à celui présenté en section 4.1 à propos de la base de 
données de phonétogrammes. Les calibrations ont également été effectuées de la même manière 
(voir section 4.4.1). 

9.1.2 Étude de la fréquence de départ 

Pour étudier l’influence de la voyelle sur la fréquence de départ du saut, nous avons demandé 
aux chanteurs d’effectuer des glissandi ascendants puis descendants, dont l’étendue est suffi¬ 
samment large pour obliger les chanteurs à utiliser les deux mécanismes laryngés (Ml et M2). 
Le temps d’exécution du glissando (ascendant et descendant) devait être compris entre 5 et 10 
secondes. Deux glissandi ont été effectués sur chaque voyelle étudiée (/a/, /i/ et /o/ fermé), soit 
en tout six glissandi par chanteur. Un exemple de production demandée a été présenté dans la 
partie 1.2.1 pour caractériser les mécanismes Ml et M2. 

Ce protocole a été enregistré à la suite de celui portant sur les phonétogrammes (voir section 
4). Il a donc été passé par les 21 chanteurs, et le dispositif expérimental est également le même, 
ainsi que les signaux enregistrés, les processus de calibration. Nous avons recueilli 151 glissandi 
exploitables en tout. 

9.1.3 Traitement des données 

Les descriptions ci-dessous portent essentiellement sur les productions de notes tenues. Les 
procédures de calcul de fréquences fondamentales et d’étiquetage des sauts sont décrits à partir 
de ce type de productions, mais ont été appliquées aux productions de glissandi. 


Calcul de la fréquence fondamentale 

Nous avons vu (section 8.1.1) que le saut de fréquence résultant de la transition de méca¬ 
nisme était particulièrement rapide, de l’ordre de quelques cycles glottiques. Pour ces raisons, 
les algorithmes habituels d’estimation de fréquence fondamentale, basés sur l’estimation d’une 
fréquence moyenne sur une large fenêtre, ne permettent pas de décrire avec précision ces va¬ 
riations brutales que l’on observe lors des transitions de mécanismes laryngés. Pour remédier à 
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cette situation, nous avons : 

- validé manuellement la détection des instants de fermeture glottique (GCI) à partir du 
signal DEGG aux voisinages des transitions de mécanisme laryngé ; 

- calculé la fréquence fondamentale à partir des GCI, en moyennant puis en effectuant un 
filtrage médian d’ordre 5. Cette méthode s’est avérée la plus efficace pour établir une 
estimation de fréquence fondamentale précise et fiable, vu les caractéristiques des données 
à analyser. 


Étiquetage des sauts 

Les instants de début (t^ep) et de fin (t arr ) de sauts de fréquence ont été déterminés manuelle¬ 
ment, à partir de la visualisation du spectrogramme du son rayonné, des courbes de fréquences 
fondamentales, de quotient ouvert ainsi que de l’enveloppe du signal EGG. Nous en avons en¬ 
suite déduit les paramètres de fréquence de déclenchement du saut ( fodep ) 5 de fréquence d’arrivée 
après la phase de réajustement (/oarr)? ainsi que l’intervalle fréquentielle du saut A/q. La dé¬ 
finition de l’ensemble de ces paramètres est schématisée figure 9.2. Outre ces paramètres, nous 
avons également évalué l’intensité avant le saut numéro k, comme étant l’intensité moyenne cal¬ 
culée entre l’instant de fin du k-l ieme saut et l’instant de début du k ieme saut, et de même pour 
l’intensité après le saut. Ainsi pour le saut numéro k, 

d db av (k^ = moyenne(Idb(t arr (k 1) : ^dep(^))) 

Idb ap (k ) = moyenne(Idb{t arr (k) : td ep {k + 1))) 



Fig. 9.2 - Notations adoptées pour décrire les transitions de mécanisme laryngé. 


Décorréler la hauteur et l’intensité : une estimation numérique de la nuance 

Nous avons vu dans le chapitre 5 que le phonétogramme permet de mettre en évidence une 
corrélation entre hauteur et intensité, corrélation dont nous nous sommes extraits en étudiant 
des coefficients de corrélation partielle. Nous avons cherché à adopter une méthodologie similaire 
pour étudier l’intervalle des sauts de fréquence. Pour cela nous avons défini une nouvelle échelle 
d’intensité, appelée SPL cor , correspondant à une échelle d’intensité sonore indépendante de la 
hauteur. Ce paramètre est défini comme suit : 

SPL cor = SPL-k v Aog(fo) 

où k v correspond à la correction à amener pour estimer le paramètre SPL cor à partir du 
SPL. Ce paramètre k v est le coefficient directeur de la droite de régression linéaire liant log(/o) 
et le SPL pour l’ensemble des transitions effectuées sur une nuance donnée et sur une voyelle 
donnée. Nous l’avons estimé en mécanisme Ml, pour chaque voyelle séparément et pour chaque 
nuance que le chanteur a produite, puis nous en avons calculé une moyenne sur les trois ou 
quatre nuances. SPL cor correspond donc à une échelle numérique exprimée en dB, dont les 
faibles valeurs correspondent aux pianissimi et les fortes valeurs au fortissimi. 
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Fig. 9.3 - Phonétogrammes de MS2, dans lesquels nous avons représenté par des points les 
positions de départ des transitions M1^M2. (a) : phonétogramme habituel (SPL en fonction de 
la hauteur), (b) : le SPL a été remplacé par SPL cor , le paramètre numérique estimant la nuance 
du chanteur. Nous constatons que 78 dB correspond à une nuance fortissimo quelle que soit la 
hauteur, ce qui n’était pas le cas sur le diagramme (a). Voyelle utilisée : /i/. 


9.2 Etude de l’intervalle du saut 

9.2.1 Résultats portant sur les notes tenues 

Nous présentons dans cette partie les résultats de notre étude portant sur l’intervalle du saut 
dans un contexte contrôlé, c’est à dire en imposant l’intensité et la hauteur de départ (il s’agit 
donc du protocole de notes tenues). 


Ml -► M2 


M2 -► Ml 


SI S3 S4 MS2 T3 Barl B3 

Fig. 9.4 - Intervalles des sauts (moyennes et écarts types), exprimés en demi-tons, mesurés 
chez les 7 sujets, dans les sens M1^M2 et M2-^M1, toutes voyelles confondues. Les numéros 
correspondent aux nombres de sauts effectués, pour chaque chanteur, dans le sens M1^M2 et 
dans le sens M2-^M1. 

La figure 9.4 présente les intervalles moyens des sauts de fréquence mesurés sur l’ensemble 
de la base de données. Nous pouvons en tirer les éléments suivants : 

Alors que T3 présente une valeur moyenne de plus de 7 demi-tons pour les transitions de Ml 
à M2, S4 n’a une valeur moyenne que de deux demi-tons. Il existe donc une variabilité importante 
entre les différents sujets quant à l’intervalle des sauts de fréquence. Globalement, la figure 9.4 
montre que l’intervalle des sauts est plus grand chez les hommes que chez les femmes, dans le sens 
M1^M2 comme dans le sens M2^M1 (en valeur absolue). Ces observations (variabilité inter- 
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sujet et différences hommes-femmes) sont en accord avec celles menées par Svec et al. (1999) et 
Miller et al. (2002), effectuées respectivement sur deux hommes et une femme, et cinq hommes 
et six femmes (mais, dans les deux cas, avec un protocole d’enregistrement très différent). Elles 
corroborent également les résultats de Roubeau et al. (1989), obtenus cette fois-ci au moyen 
d’un protocole expérimental composé de notes tenues, comme celui que nous avons utilisé. 



temps [s] 

Fig. 9.5 - Exemple de production de MS2. L’alternance de mécanisme laryngé est très bien 
marquée par la variation de l’amplitude du signal EGG et les variations de quotient ouvert. 
Néanmoins, les sauts de fréquence sont très faibles. Voyelle /a/, fa#3 (exemple sonore 17). 

Nous avons illustré en figure 9.5 un exemple de production vocale d’alternance de mécanismes 
laryngés avec des très faibles sauts de fréquences, voire pas de saut de fréquence du tout. Nous 
pouvons nettement constater ici une alternance du quotient ouvert entre 0.5 et 0.8 (environ) ainsi 
que des variations de l’enveloppe du signal EGG traduisant l’alternance de mécanismes laryngés 
imposée par le protocole. Néanmoins, nous constatons que les transitions de mécanismes laryngés 
ne sont marquées que par des sauts de fréquence de très faible intervalle (entre 1 et 2 demi-ton), 
voire par pas de saut détectable à l’oeil comme c’est le cas pour la dernière transition M2^M1 
(vers t = 5 s), où la perte de contrôle de fréquence (1.30 demi-ton) est proche de l’amplitude du 
vibrato (0.74 demi-ton). 

Nous pouvons également constater que pour chaque chanteur, les sauts effectués dans le sens 
M2^M1 sont plus petits que ceux effectués dans le sens M1^M2. Cette asymétrie a été peu 
décrite dans la littérature, du fait de l’utilisation de protocoles ne permettant pas de l’expliciter 
(Svec et al ., 1999; Miller et al ., 2002). Roubeau (1993) l’avait néanmoins déjà remarqué, ayant 
travaillé comme nous à partir de notes tenues. Lorsque le chanteur ne cherche pas à réajuster la 
fréquence fondamentale après la transition, il effectue une production de type «yodel», alternant 
entre une certaine note en mécanisme Ml et une autre en mécanisme M2. Cette situation ne 
permet naturellement pas de mettre en évidence une asymétrie en termes d’intervalle de saut 
en fonction du sens de la transition. 

Nous allons maintenant étudier la variabilité de ces sauts de fréquence avec la hauteur de 
départ du saut, et l’intensité. 


Intensité et hauteur 

Le tableau 9.1 présente les coefficients de corrélation partielle entre l’intervalle des sauts A/o 
et la fréquence de départ fodep ou l’intensité avant le saut SPL av , pour les données correspondant 
à des transitions M1^M2. 
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/a/ 

M 

N 

chanteur 

fodep 

SPL av 

fodep 

SPL av 

fodep 

SPL av 

si 

-0.37 

0.46 

-0.65 

-0.09 

-0.14 

-0.11 

S3 

0.51 

-0.16 

-0.16 

0.10 

-0.02 

0.09 

S4 

-0.46 

0.82 

-0.31 

0.47 

-0.53 

0.65 

MS2 

-0.30 

0.62 

-0.60 

0.67 

-0.47 

0.42 

T3 

-0.79 

0.78 

-0.81 

0.85 

-0.89 

0.82 

Barl 

-0.43 

0.78 

-0.53 

0.75 

-0.78 

0.89 

B3 

-0.85 

0.86 

-0.30 

0.47 

-0.92 

0.92 


Tab. 9.1 - Coefficients de corrélation partielle entre Vintervalle des sauts A/o (exprimée en 
demi-tons) correspondant à une transition dans le sens M1^M2, et fodep ou SPL av . Les 
résultats sont présentés pour les trois voyelles et les sept chanteurs séparément (Protocole des 
sons tenus). 


Les résultats présentés dans ce tableau 9.1 montrent que les coefficients de corrélation sont 
essentiellement négatifs quand ils se rapportent à fodep ? et positifs pour SPL av . Cela signifie 
que l’intervalle du saut de fréquence augmente avec l’intensité et diminue avec la fréquence de 
départ du saut. 

Par ailleurs il est intéressant de constater que les corrélations fortes sont observées essentiel¬ 
lement chez les hommes. 

Nous présentons en figure 9.6 les résultats présentant l’influence de la nuance sur l’intervalle 
du saut M1^M2 chez les sept chanteurs. Nous retrouvons, bien entendu, chez T3, Barl, B3 ainsi 
que, dans une moindre mesure, chez MS2 et S4, une augmentation de l’intervalle du saut avec 
SPL cor . Nous pouvons constater sur cette figure que cette augmentation dépend du chanteur. 
Ainsi Barl augmente-t-il son A/o de 4 demi-tons en 12 dB, alors que S4 l’augmente de 2 demi- 
tons en 9 dB (soit 3.3 demi-tons par 10 dB dans le premier cas, contre 2.2 dB par 10 dB dans 
le deuxième). 



/a/ 

M 

N 

chanteur 

fodep 

SPL av 

fodep 

SPL av 

fodep 

SPL av 

SI 

-0.43 

0.04 

-0.22 

-0.28 

0.32 

-0.31 

S3 

-0.43 

0.05 

-0.18 

0.16 

-0.10 

0.01 

S4 

-0.04 

-0.21 

0.10 

-0.25 

0.00 

-0.02 

MS2 

-0.00 

-0.48 

0.22 

-0.22 

0.11 

-0.19 

T3 

0.00 

-0.20 

-0.15 

-0.19 

0.31 

-0.54 

Barl 

-0.18 

0.06 

0.10 

-0.37 

0.32 

-0.43 

B3 

0.31 

-0.36 

-0.02 

0.05 

0.55 

-0.52 


Tab. 9.2 - Coefficients de corrélation partielle entre Vintervalle des sauts A/o (exprimée en 
demi-tons) mesurée avant et après une transition de mécanisme laryngé dans le sens M2—>M1, 
et fodep ° u SPL av . Les résultats sont présentés pour les trois voyelles et les sept chanteurs 
séparément. 

Sens M2^M1 

Le tableau 9.2 présente les coefficients de corrélation partielle observés pour les transitions dans 
le sens M2—>M1. Rappelons que les sauts dans ce sens sont de signe négatif, il faut donc inverser 
les signes des coefficients de corrélation partielle pour obtenir une description des corrélations 
entre A/o en valeur absolue, et fodep ou SPL av . 

Le résultat apparaissant le plus nettement à la vue de ces résultats est l’absence d’une 
tendance claire, comme nous l’avons observée dans le sens M1^M2. En effet nous n’observons 
pas de corrélation forte, et même les coefficients supérieurs à 0.5 (en valeur absolue) sont rares 
(il n’y en a aucun chez les femmes, et trois chez les hommes). Nous pouvons en déduire que 
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3 dB 


PP SPL cor ff pp SPL cor ff 

Fig. 9.6 - Évolution de l’intervalle du saut en fonction de la nuance (estimée par le paramètre 
SPL cor ), dans le sens M1^M2. pour les trois voyelles et les sept sujets. Chaque groupement de 
bâtons est espacé de 3 dB en termes de SPL cor . 
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la transition M2—^M1 n’est pas un simple phénomène inverse de la transition M1^M2, mais 
qu’elle a ses propriétés spécifiques. 

Influence de la voyelle sur l’intervalle du saut 

La figure 9.6 nous permet de visualiser l’influence de la voyelle sur l’intervalle du saut tout 
en tenant compte de l’influence de SPL cor . Pour chaque chanteur, l’influence de SPL cor est 
similaire quelle que soit la voyelle utilisée. Nous pouvons donc considérer l’influence de la 
voyelle comme étant un phénomène de deuxième ordre, celle de la nuance étant de 
premier ordre. 

Les résultats montrent également que l’influence de la voyelle varie en fonction du 
chanteur. Ainsi, chez T3, l’intervalle des sauts est plus faible sur la voyelle /i/ que sur /o/ 
(notamment dans la zone forte). S3 présente également des intervalles de sauts plus faibles sur 
/i/ que sur /a/ et /o/, alors que c’est sur /i/ que S4 obtient ses intervalles maximaux. 

9.2.2 Intervalles des sauts et intensités de départ sur le protocole des glis- 
sandi 

Nous avons calculé l’intervalle des sauts moyens, ainsi que l’intensité à laquelle étaient dé¬ 
clenchées les transitions. Ces résultats sont présentés dans les tableaux 9.3 et 9.4. 



/ a / 

N 

M 

Ml—>M2 

Femmes 

Hommes 

2.58 ( 1.51 ) 
3.96 ( 2.07 ) 

1.55 ( 1.14 ) 
3.1 ( 1.73 ) 

2.5 ( 1.58 ) 
3.85 ( 2.3 ) 

M2^M1 

Femmes 

Hommes 

3.1 ( 1.93 ) 
3.26 ( 2.16 ) 

2.19 ( 1.08 ) 
3.52 ( 2.22 ) 

1.9 ( 1.35 ) 
4.35 ( 2.86 ) 


Tab. 9.3 - A/o moyens (écarts types), exprimées en demi-tons, et mesurées chez les hommes 
et les femmes, pour les transitions de mécanismes se produisant pendant les glissandi, dans les 
deux sens. 



/a/ 

N 

/°/ 

Ml—>M2 

Femmes 

Hommes 

87.5 ( 6.3 ) 
90.9 ( 8.7 ) 

83.3 ( 4.4 ) 
85.1 ( 6.5 ) 

85 ( 5.0 ) 
90.1 ( 7.7 ) 

M2^M1 

Femmes 

Hommes 

86.6 ( 7.4 ) 
85.4 ( 8.6 ) 

82.0 ( 3.1 ) 
82.3 ( 6.9 ) 

84.5 ( 6.9 ) 
84.7 ( 8.2 ) 


Tab. 9.4 - SPL^ep moyennes (écarts types), exprimés en dB, et mesurés chez les hommes et les 
femmes, pour les transitions de mécanismes produites au cours des glissandi, dans les deux sens. 

Le tableau 9.3 montre que l’intervalle des sauts est un peu plus faible sur /i/ que sur /a/ et 
/o/, pour les hommes et les femmes, et dans les deux sens. Dans le même temps nous constatons 
sur le tableau 9.4 que l’intensité à laquelle le saut est déclenché est un peu plus faible sur /i/ que 
sur /a/ et /o/. Compte tenu de la corrélation que nous avons relevée dans la partie précédente 
entre la nuance et l’intervalle du saut, ce résultat est tout à fait cohérent. Nous observons 
néanmoins une tendance quant à l’influence de la voyelle sur l’intervalle du saut. 


9.3 Etude de la fréquence de départ du saut 

9.3.1 Zone phonétographique explorée avec les notes tenues 

Nous allons maintenant présenter les étendues explorées par les chanteurs au cours de l’en¬ 
registrement en termes de hauteur et d’intensité. 

La figure 9.7 présente des phonétogrammes de S3, T3 et B3, sur les voyelles /a/ et /i/, dans 
lesquels nous avons ajouté les positions de départ et d’arrivée (avant réajustement) des sauts 
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lai 


fil 


S3 




fa#2 do3 


fa#3 do4 






Fig. 9.7 - Positions de départ (fodep,SPL av ) et d’arrivée (fo ar ,SPL ap ) des transitions de mé¬ 
canismes laryngés dans le sens AI1—>M2, pour trois chanteurs, sur les voyelles /a/ et /?'/. 
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de fréquence observés lors des transitions M1^M2. Ces figures montrent que les positions de 
départ couvrent assez largement la zone de recouvrement pour S3 et T3 (sol#2 - do4 pour S3, 
mi2 - sol3 pour T3). En revanche les sauts exploités de B3 ne couvrent que la partie aigüe de la 
zone de recouvrement (sib2 - sol#3). Cette observation confirme la capacité de chanteurs même 
non-experts pour ce type de productions à effectuer des transitions de mécanismes sur une large 
étendue fréquentielle (supérieure à une octave chez S3 et T3). 

La figure 9.7 présente également un intérêt quant aux intensités étudiées. Nous constatons 
que T3 a couvert une grande plage d’intensités en mécanisme Ml, mais arrivait toujours dans 
une zone du phonétogramme de M2 assez restreinte. B3 a principalement exploré les régions 
correspondant à ses productions fortissimo dans un mécanisme comme dans l’autre. Ces obser¬ 
vations peuvent permettre d’expliquer une partie de la variabilité inter-chanteur que nous avons 
observée dans la partie précédente. 

Nous constatons également que la voyelle influence la variation d’intensité de part et d’autre 
de la transition. Cette variation est beaucoup plus faible sur /i/ que sur joj et /a/. Cette 
observation peut être mise en lien avec les phonétogrammes par mécanisme et par voyelle : nous 
avons observé que les phonétogrammes de M2 sont décalés vers le bas sur la voyelle /a/, mais pas 
sur /i/. Il est donc cohérent qu’il y ait une diminution d’intensité lors de la transition Ml—^M2 
sur /a/, et pas sur /i/. 

9.3.2 Fréquence de déclenchement des transitions dans les glissandi 

Le protocole de notes tenues ne permet pas d’étudier l’influence de la voyelle, du sens de la 
transition sur fréquence de déclenchement de la transition. Nous allons maintenant étudier ce 
point à l’aide de la base de données constituée de glissandi. 



Fig. 9.8 - Fréquence de déclenchement de la transition M1^M2 au cours des glissandi, toutes 
voyelles confondues, pour les 21 chanteurs. 

La figure 9.8 nous présente la fréquence moyenne de déclenchement du saut de fréquence 
pour les 21 chanteurs. Cette figure nous montre à nouveau la grande variabilité inter-chanteur 
quant à ce paramètre. 



/a/ 

N 

M 

Ml—>M2 

Femmes 

Hommes 

339 ( 80 ) 
307 ( 77 ) 

320 ( 44 ) 
275 ( 74 ) 

335 ( 64 ) 
300 ( 74 ) 

M2^M1 

Femmes 

Hommes 

355 ( 50 ) 
310 ( 114 ) 

292 ( 34 ) 
282 ( 73 ) 

345 ( 137 ) 
315 ( 99 ) 


Tab. 9.5 - fo^dep rnoyens (écarts types) mesurés chez les hommes et les femmes (exprimés en 
Hz), pour les transitions de mécanismes se produisant pendant les glissandi, dans les deux sens. 

Nous présentons dans le tableau 9.5 les fréquences moyennes de déclenchement des transi¬ 
tions de mécanismes laryngés, dans les deux sens. Les résultats sont détaillés par voyelle. Nous 
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observons des écarts types allant de 34 Hz à 137 Hz. Ces écarts types traduisent l’importante 
variabilité inter-chanteurs que nous avons décrite à l’aide de la figure 9.8. Outre cette variabi¬ 
lité, nous constatons que, pour les hommes comme pour les femmes, la transition de mécanisme 
(dans le sens M1^M2 comme M2^M1) est effectuée à une fréquence sensiblement plus basse 
sur la voyelle /i/ que sur /a/ et /o/. Cette tendance n’est pas statistiquement significative du 
fait de la grande variabilité inter-chanteur, mais elle est vérifiée chez 12 des 21 chanteurs. En 
moyenne, la transition est effectuée 1.7 demi-tons plus grave sur la voyelle /i/ que sur la voyelle 
/a/ dans le sens Ml—^M2 comme M2—>M1. La figure 9.9 donne une schématisation graphique 
de la fréquence fondamentale mesurée au cours de la production d’un glissando ascendant puis 
descendant, sur les voyelles /a/ et /i/. 



9.4 Discussion et conclusion 

L’étude des notes tenues confirme qu’il est possible de maîtriser (dans une certaine mesure) la 
hauteur et l’intensité à laquelle la transition doit être effectuée. Ce résultat n’est pas surprenant 
dans la mesure où ce type de maîtrise de l’instrument vocal est abondamment utilisé dans les 
techniques de chant utilisant les transitions de mécanisme (nous avons notamment cité le yodel 
et le tahrir). 

Influence de la hauteur et de SPL cor sur l’intervalle du saut 

L’intervalle du saut de fréquence et SPL cor sont corrélés positivement dans le sens M1^M2. 
Ce résultat nous permet de généraliser celui de Roubeau (1993), obtenu avec un sujet féminin 
effectuant des transitions sur des notes tenues sur une hauteur et quatre intensités différentes. 
Nous avons constaté que cette corrélation était beaucoup moins marquée dans le sens M2^M1, 
où le saut correspondrait alors à une augmentation de masse vibrante par «recouplage» des 
différentes couches. L’intervalle du saut est également inversement corrélé à la hauteur dans le 
sens M1^M2, généralisant là aussi les observations de Roubeau (1993) (un sujet aussi) ou celles 
de Svec et collaborateurs (Svec et Pesak, 1994; Svec et al ., 1999). Cette tendance est, là aussi, 
très peu marquée dans le sens M2^M1. 

Toutes choses égales, l’intensité vocale est corrélée à la pression sous-glottique. Compte tenu 
de la durée stricte du saut de fréquence (hors réajustement fréquentiel), le chanteur n’a pas 
le temps de modifier sa pression sous glottique. Les fréquences de départ et d’arrivée d’une 
transition de mécanisme correspondent donc à deux états glottiques produits avec la même 
pression sous-glottique. Or à hauteur donnée, la pression sous-glottique est plus faible en M2 
qu’en Ml (Sundberg et Hôgset, 2001). L’augmentation de l’intervalle du saut avec SPL cor 
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pourrait être dû à une différence de contrôle de la hauteur et de l’intensité à partir de la pression 
sous-glottique en Ml et en M2. Il est difficile d’être plus précis dans la mesure où le contrôle de 
la pression sous-glottique en M2 a été peu étudié. 

Influence de la voyelle sur l’intervalle du saut et sur la fréquence de déclenchement 

L’influence de la voyelle a parfois été mentionnée de façon anecdotique (Svec et al ., 1999), 
mais à notre connaissance, jamais étudiée explicitement. Nous avons vu que la voyelle pouvait 
avoir une influence sur l’intervalle du saut, mais que cette influence dépendait du chanteur. Nous 
proposons deux hypothèses pour expliquer ce résultat : 

- les voyelles ne seraient pas formées exactement de la même façon par les différents chan¬ 
teurs. Il y aurait donc bien une influence de la voyelle sur l’intervalle du saut, et la variété 
des résultats découlerait de la variété de formation des voyelles en fonction du chanteur. 

- face à la nécessité de vocaliser aigu en mécanisme Ml ou grave en mécanisme M2 (ce qui 
correspond, dans les deux cas, à la zone fréquentielle de recouvrement des mécanismes), 
le chanteur effectue des ajustements laryngés lui permettant de maintenir la voyelle. Ces 
ajustements dépendraient de la voyelle, et seraient le résultat de l’entrainement vocal. Ils 
seraient donc susceptibles de varier légèrement en fonction des chanteurs, impliquant une 
influence différente de la voyelle sur le saut de fréquence. 

Nous avons par ailleurs constaté que la voyelle influençait légèrement la fréquence de dé¬ 
clenchement de la transition (dans la situation non contrôlée). Il est intéressant de noter que 
la fréquence de déclenchement de la transition est abaissée sur la voyelle /i/, dont le premier 
formant est situé à une fréquence très proche de celle des sauts. Titze (2008) décrit cette si¬ 
tuation comme étant très favorable à la vibration glottique si Fl est situé juste au dessus de la 
fréquence fondamentale, et très défavorable si la fréquence fondamentale (ou un autre harmo¬ 
nique) passe juste au dessus de Fl. Ce phénomène d’interaction source-filtre pourrait expliquer 
pourquoi nous observons des transitions légèrement plus basses sur /i/ que sur /a/ et /o/. La 
vibration glottique étant dans une région (en termes d’activité musculaire) relativement difficile 
à stabiliser, la perturbation acoustique pourrait être le phénomène favorisant la transition. 

Transitions de mécanisme et pratiques vocales 

L’intervalle des sauts est plus petit à faible intensité, ce qui explique en partie pourquoi les 
chanteurs lyriques cherchent à diminuer l’intensité au moment de changer de mécanisme pour 
masquer la transition. Nous n’avons pas observé d’influence de la voyelle sur l’intervalle du saut. 
Il serait intéressant de confronter ce résultat avec la pratique du chant. 

Concernant l’utilisation des voyelles dans le yodel, notre travail sur les phonétogrammes 
permet déjà de proposer une interprétation: l’utilisation des voyelles ouvertes en Ml et des 
voyelles fermées en M2 permet de produire les sons dans les deux mécanismes à une intensité 
proche. Le jeu des voyelles permet également d’accentuer le contraste entre les mécanismes Ml 
et M2. 

Nous avons observé que la voyelle influence peu l’amplitude des sauts. Il est possible que 
l’ajustement des fréquences vocaliques avant et après le saut permette au chanteur, une fois 
la phase purement mécanique du saut de fréquence effectuée, d’ajuster en un temps très bref 
la fréquence fondamentale sur la note visée. Une étude complémentaires des enregistrements 
de yodel pourrait valider ou non cette hypothèse. Une autre possibilité est celle d’une action 
mécanique du changement de voyelle sur le larynx (via l’os hyoïde). 

Le geste vocal permettant de chanter du tahrir est encore inexpliqué au niveau physiolo¬ 
gique. Néanmoins notre étude permet d’observer que la voyelle n’est pas utilisée pour contrôler 
l’amplitude du saut de fréquence. La virtuosité des chanteurs de tahrir réside plus dans le contrôle 
fin des paramètres laryngés pour effectuer une phase de M2 la plus courte possible, et compte 
tenu de la brièveté de l’ornement, il est probable qu’il n’y ait pas de phase de réajustement de 
fréquence lors des transitions M1^M2. Pour expliquer cette brièveté de la phase de M2, nous 
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pouvons proposer comme hypothèse que les chanteurs de tahrir ne modifient pas leur pression 
sous-glottique entre le Ml et le M2, mais l’activité de certains muscles laryngés pour passer en 
mécanisme M2. Dans le cadre de cette hypothèse, l’étude des voyelles que nous avons présentée 
partie 8.2.3 montrerait qu’une pression sous-glottique donnée produit un son plus aigu et plus 
faible en M2 qu’en Ml sur la voyelle /a/, mais un son plus aigu et plus fort en M2 qu’en Ml sur 
le /i/. Cette différence est liée à la différence de pression sous-glottique nécessaire pour produire 
une intensité donnée sur /a/ et sur /i/ en mécanisme Ml (ce dont nous avons discuté en section 
6.3 à partir des mesures de quotient ouvert). 

9.5 Bilan 

Pour étudier l’influence de la hauteur, de l’intensité, du sens de la transition et de la voyelle 
sur l’intervalle du saut de fréquence, nous avons mis en place deux protocoles: 

- l’un consistant en des notes tenues avec alternance de mécanisme, sur différentes notes, 
intensités et voyelles. 

- un autre de glissandi ascendants et descendants sur différentes voyelles. 

La variabilité inter-sujet de l’intervalle des sauts de fréquence est très importante. Globalement, 
nous avons obtenu des intervalles de sauts plus grands chez les hommes que chez les femmes. 
Pour ces dernière, la transition M2^M1 est parfois effectuée sans aucun saut de fréquence. 

Dans le sens M1^M2, l’intervalle du saut: 

- augmente avec SPL cor , une estimation numérique de la nuance. 

- a tendance à diminuer avec la hauteur. 

- peut varier en fonction de la voyelle, mais il s’agit alors de stratégies individuelles 

Dans le sens M2^M1, nous n’avons dégagé de tendance quand à la variation de l’intervalle 
du saut ni avec la hauteur, ni avec l’intensité ni avec la voyelle. 

Lorsque la transition est effectuée à une fréquence non contrôlée (au cours de glissandi), elle 
a lieu en moyenne 1.7 demi-tons plus bas sur /i/ que sur /a/ dans les deux sens. Ce résultat est 
corrélé à la fréquence du premier formant, qui dans le cas du /i/, est très proche de la fréquence 
fondamentale au moment de la transition. 

La voyelle aurait donc tendance à modifier la fréquence de déclenchement passif de la transi¬ 
tion, mais son influence sur l’intervalle du saut reste propre à chaque individu. 


CHAPITRE 9. SAUTS DE FRÉQUENCE ET HAUTEUR, INTENSITÉ, VOYELLE 
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Conclusion générale 


Notre problématique est issue de la communauté des chanteurs, et nous l’avons décrite en 
termes d’influence de la voyelle en mécanismes Ml et M2. Nous avons orienté nos investigations 
sur les phonétogrammes, plusieurs paramètres glottiques et spectraux, et sur les transitions de 
mécanisme laryngé. 


Bilan général 

Pour mieux comprendre quelles associations les chanteurs effectuent entre mécanismes laryn¬ 
gés et voyelles, nous avons étudié plusieurs traités de chants. La question est très peu traitée de 
façon explicite, ce qui montre qu’elle n’a pas été conceptualisée ou explicitée par les auteurs des 
ouvrages que nous avons étudiés. 16 chanteurs ont accepté de remplir un questionnaire portant 
sur leur perception des mécanismes laryngés et sur les relations entre voyelles et mécanismes 
laryngés. Parmi ces chanteurs, un consensus a pu être établi dans l’association des voyelles ou¬ 
vertes ou du /a/ au mécanisme Ml et des voyelles fermées ou du /i/ au mécanisme M2 à travers 
le vocabulaire de la facilité d’émission ; les mécanismes laryngés étant perçus essentiellement à 
travers des sensations vibratoires globales, des sensations musculaires laryngées ou des sensa¬ 
tions auditives. Au cours de l’entretien qu’il nous a accordé, R. Expert, chanteur et professeur 
de chant, nous a réaffirmé la pertinence de ces associations entre voyelles et mécanismes laryngés 
dans sa pédagogie et sa pratique vocale. 

Nous avons développé l’ensemble de notre étude pour chercher des corrélats à ces observations 
effectuées dans le domaine du chant lyrique. 


L’étude phonétographique 

Nous avons cherché à comparer l’influence de la voyelle sur la dynamique vocale des chanteurs 
en Ml et en M2. Pour cela nous avons enregistré 21 chanteurs. La prise en compte des méca¬ 
nismes laryngés au niveau du protocole d’enregistrement nous a permis d’établir que la limite 
supérieure des phonétogrammes est en moyenne de 10 dB supérieure sur la voyelle /a/ que sur 
/i/ en mécanisme Ml, la limite sur la voyelle /o/ occupant une position intermédiaire; alors 
qu’en mécanisme M2, aucune différence de limite supérieure n’a été observée en relation avec 
les voyelles. La variété des phonétogrammes par voyelle observée dans la littérature est donc 
expliquée par la différence d’influence des voyelles sur les limites phonétographiques en Ml et 
en M2, indépendamment de l’entrainement vocal ou du sexe des chanteurs. 

Il est intéressant de mettre ce résultat en relation avec nos mesures de quotient ouvert. À 
hauteur et intensité fixées, nous avons observé une différence de quotient ouvert en Ml entre les 
voyelles /a/ et /i/, mais pas en M2. Ce résultat peut être expliqué par le fait que le quotient 
ouvert est inversement corrélé à la pression sous-glottique en Ml, et qu’une pression donnée 
permet de produire un /i/ moins fort qu’un /a/. Les limites supérieures des phonétogrammes 
pourraient correspondre à des configurations de pressions sous-glottiques maximales, quelle que 
soit la voyelle (donc de même pression sous-glottique sur /a/ et sur /i/, à hauteur donnée). 
Nous avons constaté par l’emploi d’une simulation basée sur l’utilisation du modèle LF que la 
différence de quotient ouvert observée entre les mécanismes Ml et M2 permettait d’expliquer une 
large part de la différence d’influence de la voyelle sur les limites supérieures de phonétogrammes 
de Ml et de M2. 
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Par rapport au témoignage des chanteurs, notre étude apporte des éléments qu’il est intéres¬ 
sant de souligner : d’abord, la dynamique vocale est plus faible sur /i/ que sur /a/ en mécanisme 
Ml, ce qui pourrait être une des explications de l’association du /a/ au mécanisme Ml effectué 
par les chanteurs. D’autre part, la considération selon laquelle le mécanisme M2 correspond à 
des sons moins forts (à hauteur donnée) s’est bien répandue dans la communauté scientifique 
du fait (entre autres) que les phonétogrammes sont habituellement effectués sur la voyelle /a/. 
Or cette considération est fausse sur la voyelle /i/, puisque nous avons observé qu’à partir du 
do2 environ, la limite supérieure des phonétogrammes de /i/ était plus intense en M2 qu’en 
Ml. Nous pouvons donc remarquer que comparativement à la voyelle /a/, la voyelle /i/ permet 
d’émettre des sons plus forts en mécanisme M2 qu’en Ml. Nous observons là un second aspect 
qui corrobore le discours des chanteurs. 

Par rapport aux nombreuses études phonétographiques disponibles dans la littérature, l’ob¬ 
servation précédente montre également que la méthode d’identification des mécanismes laryngés 
à partir de la baisse d’intensité de la limite supérieure n’est applicable, dans le meilleur cas, 
qu’aux phonétogrammes enregistrés sur la voyelle /a/. Elle n’est pas valide sur les phonéto¬ 
grammes de /o/ (et peut même être attribuée à tort à des changements d’alignements entre 
harmoniques et formants) ni de /i/. La pente de la limite supérieure des phonétogrammes ne 
varie pas selon la voyelle. Nous avons observé des pentes phonétographiques variant avec le mé¬ 
canisme laryngé. Ce résultat ne peut pas être généralisé à l’ensemble du phonétogramme dans 
la mesure où nous n’avons enregistré que des phonétogrammes partiels (restreints à la tessiture 
do2-do4). 

Nous avons par ailleurs explicité la présence d’une large zone phonétographique produite 
sans accolement glottique détecté par l’EGG. Cette zone correspond à des émissions pianissimo. 
Elle est détectable sur le signal EGG par une amplitude très faible, et sur sa dérivée par l’absence 
de pics d’ouverture et de fermeture. Cette zone phonétographique est particulièrement étendue 
chez les soprani, et correspond à des productions que ces chanteuses sont susceptibles d’utiliser 
pour chanter (donc dont la qualité vocale est acceptable, selon des critères non explicités ici 
et appartenant au domaine de la technique vocale lyrique). La prise en compte ou non de 
cette zone lors de l’enregistrement d’un phonétogramme influence fortement la détermination 
de la limite inférieure, et explique donc une partie de la variabilité des résultats décrits dans la 
littérature par rapport à cette limite inférieure. Elle influence également fortement le calcul de 
l’aire phonétographique. 

Nous avons également étudié des phonétogrammes d’amplitude de l’EGG (indice de la surface 
de contact des cordes vocales) et de position verticale du larynx (VLP). Nous avons observé 
que l’amplitude de l’EGG est fortement positivement corrélée à l’intensité en mécanisme M2, et 
également dans une moindre mesure (plutôt chez les femmes que chez les hommes) en mécanisme 
Ml, sur les trois voyelles étudiées. Nous avons vérifié que l’amplitude de l’EGG est plus faible 
en M2 qu’en Ml à hauteur et intensité fixées, ce résultat traduisant la plus faible surface de 
contact des cordes vocales en M2 qu’en Ml. 

Les résultats concernant l’influence de la voyelle sur l’amplitude de l’EGG dépendent beau¬ 
coup du chanteur. La tendance observée est qu’elle est un peu plus grande sur /i/ que sur /a/ 
en Ml, et dans une moindre mesure en M2. La voyelle /i/ favoriserait donc le contact glottique. 
Nous avons observé que la position verticale du larynx ne variait pas selon des tendances par¬ 
tagées par l’ensemble des chanteurs en fonction de la hauteur ou de l’intensité, bien qu’il existe 
des stratégies personnelles. Nous notons que les chanteurs de Ml abaissent plus leur larynx en 
Ml qu’en M2 et inversement pour les chanteurs de M2, ce qui confirme que la position du larynx 
est fortement liée à la technique vocale. Par rapport aux voyelles, nous avons constaté que les 
chanteurs ont tendance à avoir un larynx plus haut sur /i/ que sur /a/ en Ml, et inversement en 
M2, pour les chanteurs de M2 seulement. La tendance observée en mécanisme Ml est conforme 
aux études menées (essentiellement en parole), et pourrait être liée à la position de la langue. 
L’observation du mécanisme M2 reste à expliquer, nous constatons quoi qu’il en soit qu’il y a 
un aspect d’entrainement vocal important à prendre en compte. 
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L’étude spectrale 

Pour étudier la répartition de l’énergie dans le spectre, nous avons défini trois bandes de 
fréquences, puis nous avons étudié le rapport d’énergie de deux de ces trois bandes par rapport 
à l’énergie totale. Pour les hommes, FBI va de 0 à 2 kHz, FB2 de 2 à 4.5 kHz, et FB3 de 4.5 à 
10 kHz. Pour les femmes, FBI va de 0 à 2.4 kHz, FB2 de 2.4 à 5.4 kHz, FB3 de 5.4 à 12 kHz. 
De la sorte, FB2 comprend le formant du chanteur et FB3 les hautes fréquences. 

L’énergie du formant du chanteur est plus grande sur /i/ que sur /o/ et /a/, à hauteur et 
intensité données. Le rapport d’énergie dans FB2 avec l’énergie totale (ER(FB2)) adopte des 
profils de variation avec le SPL très diverses, en fonction des chanteurs, de la hauteur, de la 
voyelle, et du mécanisme laryngé. Dans de nombreux cas, il présente une saturation au cours 
de laquelle ce rapport n’augmente plus avec le SPL. Sur /a/, cette saturation a été observée 
en mécanisme Ml chez les chanteurs professionnels et dans la tessiture qu’ils utilisent le plus 
communément. Sur /i/, nous l’avons observée chez tous les chanteurs en Ml et chez les chan¬ 
teurs professionnels de mécanisme M2 (contre-ténors, voix de femmes) en M2. Par ailleurs, les 
chanteurs de mécanisme Ml ont un formant du chanteur plus ample en Ml qu’en M2, alors que 
les chanteurs utilisant les deux mécanismes sont capables de l’égaliser. Le formant du chanteur 
n’est donc pas développé de la même façon en fonction de la tessiture abordée par le chanteur 
et de sa pratique des mécanismes. 

Le rapport de l’énergie dans FB3 avec le SPL varie avec la hauteur, mais les profils de 
variation de ce paramètre avec le SPL sont très variés. A hauteur et intensité données, il est 
plus faible en M2 qu’en Ml. Globalement il est plus grand sur /i/ que sur /a/, suivant la même 
évolution que le rapport d’énergie de FB2 avec le SPL. 

L’étude des transitions de mécanisme laryngé 

Nous avons observé différentes utilisations musicales des transitions de mécanisme laryngé. Les 
chanteurs lyriques travaillent pour la masquer, dans d’autres cultures elles sont utilisées comme 
ornement. La maitrise du yodel nécessite un contrôle fin de l’amplitude du saut, et utilise les 
voyelles pour marquer le contraste et peut-être faciliter la transition entre les deux mécanismes. 
Les voyelles utilisées en Ml sont les voyelles ouvertes et celle en M2 les voyelles fermées, ce qui 
correspond aux associations effectuées par les chanteurs lyriques entre mécanismes et voyelles, 
confirmant l’existence d’une relation entre mécanismes et voyelles. 

Nous avons souhaité déterminer si la voyelle avait une influence sur l’intervalle du saut. Pour 
cela nous avons mis en place deux protocoles, l’un basé sur des notes tenues avec alternances de 
mécanismes, l’autre sur des glissandi avec changement de mécanisme. Le premier protocole nous 
a permis d’établir que l’intervalle des sauts dépend fortement du chanteur. Cet intervalle est 
globalement plus faible pour les femmes, et peut même approcher zéro demi-tons, notamment 
dans le cas des transitions M2^M1. L’intervalle du saut est très fortement positivement corrélé 
à l’intensité (quant elle est décorrélée de la hauteur), et inversement corrélé à la hauteur dans 
le sens M1^M2 pour les hommes. Une tendance similaire, mais moins forte, est observée chez 
les femmes. Dans le sens M2^M1 nous n’avons observé aucune tendance. La voyelle semble 
avoir une influence sur l’intervalle des sauts chez certains chanteurs, mais cette influence n’est 
pas la même chez tous les chanteurs. Effectuée lors de glissandi, la transition de mécanisme est 
déclenchée un peu plus bas (1.7 demi-ton en moyenne) sur la voyelle /i/ que sur la voyelle /a/, 
dans les sens M1^M2 et M2^M1. La position basse du premier formant sur le /i/ pourrait être 
responsable du déclenchement de la transition de mécanisme. 


Discussion : quelle relation entre voyelles et mécanismes ? 

L’étude phonétographique a clairement montré que la dynamique vocale était plus grande sur 
/a/ que sur /i/ en Ml, et que comparativement au /a/, la voyelle /i/ permettait une plus grande 
dynamique en M2 qu’en Ml. La dynamique vocale peut donc être un paramètre sur lequel se 
basent les chanteurs pour effectuer leurs associations entre mécanismes laryngés et voyelles. La 
différence de dynamique est liée au fait qu’une pression sous-glottique donnée permet d’émettre 
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un son plus fort sur /a/ que sur /i/ en mécanisme Ml (voir la discussion de la section 6.3). De 
plus la voyelle /i/ est associée à une surface de contact glottique plus importante que /a/, ce 
que les chanteurs pourraient être amenés à contrebalancer par une augmentation de la pression 
sous-glottique pour retrouver un équilibre vocal (accord pneumo-phono-résonantiel). L’émission 
de la voyelle /i/ serait donc plus difficile, dans le sens où elle demande un investissement corporel 
plus important que la voyelle /a/, en mécanisme Ml, à hauteur et intensité fixées. À cela, nous 
pouvons encore ajouter le fait que la voyelle /i/, de par la position haute de la langue qu’elle 
nécessite, tend à faire monter le larynx, ce qui s’oppose à la technique vocale lyrique tendant à 
maintenir le larynx bas dans la partie aigüe du mécanisme Ml. 

Un des éléments nous permettant peut être de comprendre le témoignage des chanteurs tient 
au fait que dans la tessiture étudiée, donc dans la zone de recouvrement des mécanismes, le mé¬ 
canisme Ml est émis avec des niveaux de pressions sous-glottiques très grands, et probablement 
des contractions musculaires au niveau laryngé très importantes, par rapport au mécanisme M2. 
Cela tient au fait que la tessiture étudiée porte sur l’aigu du mécanisme Ml et le grave du 
mécanisme M2. La problématique pour chanter dans cette tessiture n’est donc pas du tout la 
même, selon que le chanteur utilise le Ml ou le M2. En mécanisme M2 globalement, le chanteur 
se doit d’entretenir une vibration laryngée, et de timbrer le son. Pour cela la voyelle /i/ semble 
préférable à la voyelle /a/ en mécanisme M2 : s’il est effectif que le /i/ favorise la vibration glot¬ 
tique, alors cette voyelle permettra de descendre plus facilement ou avec un meilleur accolement 
glottique que la voyelle /a/, en mécanisme M2. Nous avons d’ailleurs constaté que l’amplitude 
du formant du chanteur, plus grande sur /i/ que sur /a/, permet au chanteur d’avoir un timbre 
plus riche sur /i/ que sur /a/. 

L’étude des transitions de mécanisme a montré que la voyelle influençait peu l’intervalle du 
saut de fréquence, et que la transition de mécanisme est effectuée plus bas sur /i/ que sur /a/. 
Lors du glissando ascendant, en mécanisme Ml, le chanteur mène sa voix dans une région où 
(si il ne fait pas appel à une technique particulière pour maintenir le mécanisme Ml) elle est de 
moins en moins stable. Maintenir le mécanisme Ml relève donc d’une gestion de plus en plus 
fine et de plus en plus sujette à toute perturbation. La présence du premier formant proche de la 
fréquence fondamentale peut alors provoquer la transition laryngée d’un système peu stable vers 
une configuration plus stable, à savoir le mécanisme M2. Il apparait que, de par la fréquence du 
premier formant, le /i/ favorise une plus grande stabilisation du mécanisme M2 que le /a/. Cette 
plus grande stabilisation pourrait s’expliquer par les arguments que nous avons développés dans 
le paragraphe précédent. 


Avons-nous observé des interactions source-filtre? 

Comme nous venons de le discuter, la voyelle a une influence sur la production vocale globale, 
que le chanteur corrige si nécessaire, par exemple en augmentant un peu la pression sous-glottique 
sur /i/ par rapport au /a/, en mécanisme Ml notamment. Néanmoins cet aspect précis ne remet 
pas directement en cause l’hypothèse d’indépendance de la source et du filtre dans la mesure où 
l’intensité est un paramètre de sortie du système et non un paramètre d’entrée. 

Le concept d’interaction source-filtre est issu des modèles de production vocale et non de 
l’expérimentation. Sur le plan conceptuel, nous pouvons envisager différents types d’interactions. 

La première catégorie regrouperait les interactions purement acoustiques : dans ce cadre, 
le filtre a une influence sur l’onde de débit glottique seule, ou sur l’ODG et la vibration glot¬ 
tique elle-même. C’est vraisemblablement le type d’interaction observé avec les transitions de 
mécanismes effectuées sur les glissandi. Notre observation est effectuée alors que le chanteur 
ne cherche pas à masquer la transition. Par rapport à ce phénomène passif, il peut néanmoins 
apprendre comment masquer la transition ou l’éviter (en restant dans le même mécanisme). Il 
peut également ajuster sa vibration laryngée par rapport à cette interaction, en fonction du 
mécanisme utilisé. 

Une autre catégorie pourrait désigner les interactions mécaniques, il s’agit de l’influence de 
la musculature permettant de contrôler la forme du conduit vocal (les muscles de la langue 
notamment), sur la musculature laryngée. Cette interaction est présente dans la mesure où la 
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voyelle influence par exemple la position du larynx. 

Si l’on s’en tient à une étude purement expérimentale, il est difficile d’identifier quels aspects 
résultent de quel type d’interaction, ce qui est lié au fait que le chanteur ne vise pas à limiter 
tel ou tel effet mais à obtenir une production vocale qui soit globalement valable. De plus le 
caractère actif (contrôlé par le chanteur) ou passif (subit par le chanteur quoi qu’il arrive) 
n’est pas évident à déterminer, comme nous l’avons souligné à propos des ajustements entre 
harmoniques et fréquences formantiques. 


Perspectives 

Si notre travail a permis de clarifier un certain nombre de points et de répondre à différentes 
questions, il soulève aussi beaucoup d’interrogations et suggère plusieurs problématiques dont 
nous allons maintenant présenter les principales. 


Mécanismes et voyelles 

Au cours de notre étude, nous avons approché la problématique des voyelles à travers trois 
d’entre elles, le /a/, le /i/ et le /o/. Il s’agit évidemment d’une vision très réductrice de l’ensemble 
des voyelles. Bien que ces trois voyelles soient proches des angles du triangle vocalique (nous 
rappelons que nous avons choisi le /o/ car le /u/ est sujet à de fortes modifications dans le 
chant, par rapport à la voyelle parlée), il serait intéressant d’étendre l’étude à d’autres voyelles. 

Nous pouvons aborder les voyelles d’un point de vue perceptif. Au cours de l’enregistrement, 
nous avons contrôlé «h l’oreille» les voyelles produites par les chanteurs, et demandé le cas 
échéant à refaire une production si nous considérions la voyelle trop éloignée de ce que nous 
demandions. Une étude de catégorisation des voyelles chantées sur les limites phonétographiques 
nous permettrait d’évaluer dans quelle mesure notre protocole a effectivement été respecté. 

Nous avons abordé la description acoustique des voyelles par les mesures de fréquences for¬ 
mantiques effectuées sur les productions de MO. Cette méthode ne nous a pas permis de décrire 
les ajustements fins que les chanteurs ont été susceptibles d’effectuer dans un mécanisme et pas 
dans l’autre. Il nous semble qu’une étude orientée sur la caractérisation des voyelles en Ml et en 
M2, en fonction de la hauteur et de l’intensité, apporterait un complément substantiel à notre 
travail. Elle peut par exemple être effectuée par mesure des résonances du conduit vocal. 

Enfin, et pour compléter notre étude sur les estimations formantiques en MO, il serait inté¬ 
ressant de mesurer les fréquences formantiques sur les productions de Ml ou de M2 et sur les MO 
qui suivent, alors que le chanteur maintient la configuration du conduit vocal. Couplée à un test 
de catégorisation des voyelles perçues, cette étude permettrait de déterminer si la reconnaissance 
des voyelles est liée uniquement aux positions formantiques, ou si elle est aussi liée à la fréquence 
vibratoire, voire au mécanisme laryngé. 


Le mécanisme M2 

Comme nous avons eu l’occasion de le souligner à plusieurs reprises au long du manuscrit, 
l’essentiel des études traitant de la production vocale est centré sur la parole. Par ailleurs, les 
études qui ont été menées sur la voix chantée ont été effectuées par des scientifiques masculins, 
qui ont souvent basé leurs études et établi leurs concepts, à partir de leur propre expérience de 
la voix. Petit à petit, les méthodes d’analyse et les modèles qui ont été développés permettaient 
essentiellement d’étudier la parole et le chant masculins (la plus connue d’entre elle étant le 
filtrage inverse). En conséquence, les connaissances du fonctionnement du mécanisme M2 sont 
relativement limitées par rapport à celles du mécanisme Ml: il reste beaucoup à comprendre, 
notamment en termes d’activités musculaires et de gestion de la pression sous-glottique, en M2. 
Les recherches futures orientées sur ces problématiques permettront sans aucun doute de mieux 
comprendre les différences de gestion des voyelles en Ml et en M2. 

L’étude approfondie du mécanisme M2 au même titre que le Ml permettra également de 
mieux comprendre les différences vocales entre les hommes et les femmes. Comme nous l’avons 
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déjà souligné, dans le chant lyrique, une différence majeure est que les hommes utilisent principa¬ 
lement le Ml et les femmes principalement le M2. Que reste-t-il des différences hommes-femmes 
une fois que nous comparons les productions vocales à même mécanisme laryngé, à même hau¬ 
teur et même intensité? Par exemple nous avons vu, grâce aux deux contre-ténors avec lesquels 
nous avons travaillé, que plusieurs aspects, comme l’égalisation de l’énergie du formant du chan¬ 
teur en Ml et en M2 dans la zone de recouvrement, tenait à une pratique vocale et non au 
sexe du chanteur. Dans le chant lyrique, une telle étude se heurte au fait que les hommes et 
les femmes ne sont pas entraînés de la même façon à utiliser les deux mécanismes laryngés. La 
comparaison des mécanismes Ml et M2 pourrait donc être effectuée avec des chanteurs hommes 
et femmes, entraînés de la même façon à utiliser les mécanismes laryngés, donc issus d’un autre 
milieu que celui du chant lyrique. Ce pourrait être une étude sur différents styles de musiques 
traditionnelles, ou sur des musiques de variété (le belting notamment). 

Le phonétogramme 

Le phonétogramme présente l’ensemble des productions possibles dans le plan fréquence- 
intensité. Nous avons également étudié des phonétogrammes par paramètres, qui permettent 
de visualiser les valeurs d’un paramètre donné dans le plan phonétographique. L’établissement 
de phonétogrammes en distinguant les mécanismes laryngés lors de l’enregistrement nous a 
permis d’étudier la zone de recouvrement des mécanismes, et de décrire la dynamique vocale 
dans ces deux mécanismes. 

Pour faire progresser la connaissance à partir des phonétogrammes, nous pensons que la 
question à laquelle nous devons maintenant répondre est celle de savoir ce que nous souhaitons 
étudier et représenter par le phonétogramme. Sur ces deux axes, nous avons placé des paramètres 
acoustiques (la fréquence et le SPL), mais ces paramètres sont parfois utilisés pour approcher des 
grandeurs plutôt perceptives. Nous suggérons d’orienter le phonétogramme vers une description 
plus précise de certains aspects liés à la voix chantée. Nous avons développé au cours de notre 
travail plusieurs niveaux de lecture : l’aspect de production vocale, l’aspect acoustique et l’aspect 
perceptif. 



0.5 1 1.5 2 2.5 

temps [s] 


Fig. 9.10 - Crescendo produit par CTI sur un do2, en mécanisme Ml, sur la voyelle /a/ (exemple 
sonore 18). 

Le SPL est un paramètre particulièrement éloigné de la notion perceptive d’intensité sonore, 
en particulier en voix chantée. À titre d’illustration, nous avons présenté dans la figure 9.10 un 












































CONCLUSION GENERALE 


157 


crescendo effectué par CTI sur un do2, voyelle /a/. Vers t = 1 s, le crescendo atteint sa limite 
en termes de SPL, mais nous observons des stratégies supplémentaires utilisées une fois atteint 
le maximum de SPL. En particulier, le vibrato de fréquence se déclenche, puis la fréquence du 
quatrième formant diminue, ce qui a probablement pour effet une diminution de la largeur de 
bande du formant du chanteur, mais aussi une augmentation de son niveau. Nous considérons 
que l’amplitude du formant du chanteur et le vibrato sont deux éléments importants dans la 
perception de l’intensité vocale. L’utilisation d’une échelle d’intensité exprimée en phones ou 
en sones (Hunter et Titze, 2005; Hunter et al ., 2006) permet déjà de mieux prendre en compte 
le formant du chanteur. Il serait en particulier intéressant de voir dans quelle mesure cette 
modification compense la différence observée entre les limites supérieures des phonétogrammes 
de Ml sur les voyelles /a/, j\j et /o/. Pour approcher plus finement encore l’intensité perçue, il 
pourrait être nécessaire d’établir une nouvelle échelle prenant en compte le vibrato. 

Pour décrire plus précisément le fonctionnement de l’appareil vocal, il serait intéressant 
de définir des phonétogrammes physiologiques, en remplaçant l’axe d’intensité par un axe de 
pression sous-glottique. Nous aurions alors une description nouvelle des potentialités vocales, et 
peut-être un positionnement relatif nouveau des mécanismes laryngés. Ce travail pose néanmoins 
la question épineuse de l’estimation de la pression sous-glottique, question à laquelle Lamarche 
et Ternstrôm (2008) ont tenté de répondre par la mesure du niveau d’accélération de la peau 
du cou (skin accélération level), sans résultats probants selon les auteurs. Dans un futur plus 
lointain encore, nous pouvons imaginer remplacer la fréquence vibratoire par l’activité d’un 
muscle intrinsèque. 

La transformation à appliquer pour passer d’un phonétogramme de source (c’est-à-dire 
orienté vers une description du fonctionnement glottique) à un phonétogramme de perception 
pourrait également faire l’objet d’une étude approfondie. 


La comparaison entre Ml et M2 : quelle méthodologie? 

Dans l’ensemble de la thèse, nous avons pris le parti de comparer les productions de Ml 
et de M2 à hauteur et intensité fixées. Ce choix s’inscrit dans une description acoustique des 
phénomènes. Comme nous l’avons mentionné un peu plus haut, elle a le défaut de comparer le 
mécanisme Ml dans une zone de forte tension au mécanisme M2 dans une zone de faible ten¬ 
sion (en termes musculaires). D’autres façons de comparer les productions des deux mécanismes 
peuvent néanmoins être envisagées. Par exemple, il pourrait être pertinent de comparer des pho¬ 
nétogrammes de Ml et de M2 en utilisant les méthodes de normalisation de fréquence (rescaling 
method ), pour voir quel mécanisme est le plus étendu, quel mécanisme permet de produire les 
sons les plus forts, mais aussi quel mécanisme nécessite la plus grande pression sous-glottique, 
etc. Ce travail doit évidemment être effectué avec des chanteurs de Ml et des chanteurs de M2, 
puisque l’étendue fréquentielle de chaque mécanisme ainsi que la dynamique vocale dépendent 
de l’entrainement vocal. À partir de là, nous pouvons comparer des productions de Ml et de M2, 
situées par exemple au milieu de la tessiture de chaque mécanisme laryngé (ce qui ne correspond 
pas à la même fréquence). Il est probable que cette méthode s’approche d’une comparaison à 
effort musculaire plus comparable (ce serait à vérifier). Dans un avenir plus lointain, nous pou¬ 
vons aussi imaginer de comparer des productions de Ml et de M2 pour une activité donnée des 
muscles thyro-aryténoïdiens et crico-thyroïdiens, ou pour une pression sous-glottique donnée et 
une activité donnée d’un des muscles intrinsèques. 


Acoustique et chant: quelle pluridisciplinarité? 

La voix chantée est un domaine fondamentalement pluridisciplinaire. Aujourd’hui, même dans 
le domaine académique, plusieurs champs disciplinaires traitent du chant, en plus de toutes les 
approches non académiques, au premier rang desquelles nous placerons la pratique artistique. 
Nous considérons chaque domaine ou chaque approche comme un point de vue sur notre objet 
d’étude multidimensionnel. Nous avons fait le choix, dès l’établissement de notre problématique, 
de nous intéresser aux relations entre mécanismes et voyelles, car ces relations posent question 
à la fois dans le domaine musical et le domaine scientifique. Nous avons bénéficié de l’approche 
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développée depuis de nombreuses années au LAM, visant à travailler avec des musiciens, en les 
considérant comme des collaborateurs plus que comme des sujets, ce qui leur permet de nous 
apporter une partie de leur expertise et leur connaissance de la voix. Cet apport nous a permis de 
prendre conscience de la distance entre un certain aspect un peu rudimentaire des descriptions 
acoustiques et physiologiques du fonctionnement vocal, et la grande finesse de ressenti développée 
par les artistes. Cette distance est liée à la différence d’approche, l’une analytique, l’autre fondée 
sur l’expérience. 

Dans le but de décrire plus clairement notre problématique du point de vue des chanteurs, 
nous avons mis en place une collaboration avec Danièle Dubois et Luiza Maxim pour dépouiller 
les données verbales que nous avions recueillies. Cette approche nous a permis de comprendre 
quelles associations les chanteurs font entre mécanismes et voyelles, comment ils perçoivent 
les mécanismes laryngés. L’analyse linguistique permet en outre d’expliciter la façon dont les 
chanteurs se positionnent par rapport à ce qu’ils décrivent. Nous pensons que le développement 
de cette approche permettra d’affiner les descriptions du fonctionnement de l’appareil vocal, en 
lien plus étroit avec l’expertise des chanteurs. 

Nous avons également fait l’expérience de cette cohabitation difficile entre acoustique et 
chant en termes de validité écologique du protocole d’enregistrement : nous avons constaté une 
tension forte entre les exigences de la science acoustique et celles des conditions dans lesquelles 
un chanteur peut prétendre résolument effectuer des productions artistiquement valables. Beau¬ 
coup des chanteurs ayant participé à notre travail ont mentionné avoir effectué des productions 
vocales, mais qui ne représentent pas ce qu’ils produiraient en concert. Le fait de travailler avec 
des chanteurs très professionnels et habitués aux contraintes expérimentales permet, selon nous, 
de minimiser cet écart, mais probablement pas de l’éliminer. Dans le même temps, travailler 
exclusivement avec des professionnels ne permet pas d’étudier certains aspects comme l’entrai¬ 
nement vocal. Il s’agit donc, en fonction du type d’étude visée, de trouver un équilibre entre les 
exigences du dispositif utilisé et celles des chanteurs. 

Un autre aspect de la distance entre l’approche des chanteurs et celles des scientifiques s’est 
manifesté lors du dépouillement des données : l’étude de la corrélation entre deux paramètres 
s’avère compliquée à effectuer s’il est nécessaire de prendre systématiquement en compte la 
hauteur, l’intensité, les voyelles, les mécanismes laryngés, et en plus la variabilité inter-sujet, 
l’expertise des chanteurs, le sexe, leur utilisation d’un mécanisme plutôt que de l’autre... 

Nous pensons que la distance entre description acoustique et pratique vocale est aussi liée à 
la façon dont la connaissance du fonctionnement vocal dans le chant a été construite, c’est à dire 
comme un prolongement de la parole. À ce titre, nous estimons avoir eu la chance d’évoluer au 
sein du LAM où la plupart des chercheurs ont une connaissance et une expérience de la musique, 
du niveau amateur à un niveau quasi-professionnel selon les personnes, et où les fondateurs du 
laboratoire ont toujours insisté pour lier l’expertise musicale (notamment en termes de finesse 
d’écoute) et l’expertise scientifique. Nous pensons qu’une approche pluridisciplinaire de la voix 
chantée permettra d’établir des liens concrets entre les différents domaines d’expertises traitant 
du chant, ce qui pourra permettre d’établir une connaissance commune, donc objective et élargie 
à propos de notre objet d’étude. 
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Annexe A 

Détails des analyses statistiques 


Nous allons présenter l’ensemble des détails des analyses statistiques dont nous avons présenté 
les résultats au cours du manuscrit. Il s’agit uniquement d’anayses de variances (ANOVA) à 
une dimension. Pour l’ensemble des tableaux, dl désigne le nombre de degrés de libertés, F la 
statistique et p la p-valeur. 

A.l Test de l’influence de la voyelle sur les limites phonétogra- 
phiques 



Ml 

M2 


dl 

F 

P 

dl 

F 

P 

do2 

38 

0,07 

0,928 

ns 

8 

1,19 

0,366 

ns 

ré2 

38 

0,15 

0,858 

ns 

28 

0,21 

0,813 

ns 

mi2 

38 

0,16 

0,849 

ns 

37 

0,74 

0,485 

ns 

fa#2 

38 

0,06 

0,946 

ns 

37 

1,08 

0,351 

ns 

sol#2 

38 

0,05 

0,952 

ns 

38 

0,81 

0,452 

ns 

sib2 

38 

0,05 

0,955 

ns 

38 

1,04 

0,364 

ns 

do3 

38 

0,02 

0,984 

ns 

38 

1,70 

0,197 

ns 

ré3 

38 

0,03 

0,975 

ns 

38 

2,05 

0,144 

ns 

mi3 

35 

0,42 

0,662 

ns 

38 

1,66 

0,204 

ns 

fa#3 

28 

0,01 

0,990 

ns 

38 

2,00 

0,150 

ns 

sol#3 

16 

0,38 

0,694 

ns 

38 

1,22 

0,307 

ns 

sib3 

8 

1,04 

0,409 

ns 

38 

1,41 

0,258 

ns 

do4 

5 

0,48 

0,660 

ns 

36 

0,11 

0,895 

ns 


Tab. A.l - Résultats statistiques de Vinfluence de la voyelle sur la limite inférieure des 
phonétogrammes, en Ml et en M2 séparément. Chanteurs hommes. 
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Ml 

M2 


dl 

F 

P 

dl 

F 

P 

do2 

11 

0,28 

0,760 

ns 

0 




ré2 

16 

0,79 

0,473 

ns 

4 

0,38 

0,727 

ns 

mi 2 

21 

1,24 

0,312 

ns 

11 

1,40 

0,295 

ns 

fa# 2 

23 

0,08 

0,925 

ns 

16 

0,26 

0,777 

ns 

sol#2 

23 

0,25 

0,780 

ns 

17 

0,51 

0,614 

ns 

sib2 

23 

0,02 

0,983 

ns 

19 

1,72 

0,210 

ns 

do3 

23 

1,24 

0,311 

ns 

22 

1,90 

0,176 

ns 

ré3 

23 

1,47 

0,253 

ns 

23 

1,33 

0,286 

ns 

mi3 

23 

0,46 

0,636 

ns 

23 

0,85 

0,441 

ns 

fa# 3 

23 

0,18 

0,835 

ns 

23 

1,04 

0,369 

ns 

sol#3 

15 

0,39 

0,683 

ns 

23 

1,41 

0,266 

ns 

sib3 

9 

0,17 

0,846 

ns 

23 

0,46 

0,637 

ns 

do4 

5 

0,09 

0,919 

ns 

23 

0,13 

0,877 

ns 


Tab. A.2 - Résultats statistiques de Vinfluence de la voyelle sur la limite inférieure des 
phonétogrammes, en Ml et en M2 séparément. Chanteurs femmes. 



Ml 

M2 


dl 

F 

P 

dl 

F 

P 

do2 

38 

13,10 

0,000 

*** 

8 

2,23 

0,189 

ns 

ré2 

38 

23,20 

0,000 

*** 

28 

0,29 

0,752 

ns 

mi2 

38 

37,40 

0,000 

*** 

37 

0,28 

0,761 

ns 

fa# 2 

38 

26,40 

0,000 

*** 

37 

0,63 

0,538 

ns 

sol#2 

38 

29,30 

0,000 

*** 

38 

0,99 

0,381 

ns 

sib2 

38 

32,80 

0,000 

*** 

38 

1,80 

0,181 

ns 

do3 

38 

40,90 

0,000 

*** 

38 

0,90 

0,417 

ns 

ré3 

38 

26,80 

0,000 

*** 

38 

1,94 

0,159 

ns 

mi3 

35 

8,23 

0,001 

** 

38 

4,92 

0,013 

* 

fa# 3 

28 

9,75 

0,001 

*** 

38 

2,04 

0,145 

ns 

sol#3 

16 

2,04 

0,167 

ns 

38 

4,53 

0,018 

* 

sib3 

8 

0,44 

0,665 

ns 

38 

0,66 

0,524 

ns 

do4 

5 

0,05 

0,953 

ns 

36 

1,27 

0,295 

ns 


Tab. A.3 - Résultats statistiques de Vinfluence de la voyelle sur la limite supérieure des 
phonétogrammes, en Ml et en M2 séparément. Chanteurs hommes. 
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Ml 

M2 


dl 

F 

P 

dl 

F 

P 

do2 

23 

7,87 

0,003 

** 

4 

0,79 

0,557 

ns 

ré2 

23 

13,90 

0,000 

*** 

20 

0,84 

0,447 

ns 

mi2 

23 

22,10 

0,000 

*** 

22 

0,20 

0,819 

ns 

fa#2 

23 

15,30 

0,000 

*** 

22 

0,60 

0,560 

ns 

sol#2 

23 

26,20 

0,000 

*** 

23 

1,58 

0,230 

ns 

sib2 

23 

38,80 

0,000 

*** 

23 

5,21 

0,015 

* 

do3 

23 

45,10 

0,000 

*** 

23 

5,55 

0,012 

* 

ré3 

23 

18,00 

0,000 

*** 

23 

6,31 

0,007 

** 

mi3 

21 

5,22 

0,016 

* 

23 

9,62 

0,001 

** 

fa# 3 

16 

15,60 

0,000 

*** 

23 

3,70 

0,042 

* 

sol#3 

7 

2,25 

0,201 

ns 

23 

1,77 

0,195 

ns 

sib3 





23 

0,03 

0,966 

ns 

do4 





21 

1,68 

0,213 

ns 


Tab. A.4 - Résultats statistiques de l’influence de la voyelle sur la limite supérieure des 
phonétogrammes, en Ml et en M2 séparément. Chanteurs femmes. 


A.2 Test de l’influence de la voyelle sur la dynamique vocale 



Ml 

M2 


dl 

F 

P 

dl 

F 

P 

do2 

38 

6,77 

0,003 

** 

8 




ré2 

38 

8,96 

0,001 

*** 

28 

0,08 

0,919 

ns 

mi 2 

38 

11,80 

0,000 

*** 

37 

0,60 

0,556 

ns 

fa# 2 

38 

4,67 

0,016 

* 

37 

1,96 

0,156 

ns 

sol#2 

38 

6,50 

0,004 

** 

38 

1,96 

0,156 

ns 

sib2 

38 

5,71 

0,007 

** 

38 

2,66 

0,083 

* 

do3 

38 

7,42 

0,002 

** 

38 

3,10 

0,057 

* 

ré3 

38 

3,01 

0,062 

* 

38 

1,89 

0,166 

ns 

mi3 

35 

0,57 

0,571 

ns 

38 

4,16 

0,024 

* 

fa# 3 

28 

1,44 

0,256 

ns 

38 

2,08 

0,139 

ns 

sol#3 

16 

0,08 

0,920 

ns 

38 

0,32 

0,726 

ns 

sib3 

8 




38 

0,82 

0,448 

ns 

do4 

5 




36 

0,25 

0,778 

ns 


Tab. A.5 - Résultats statistiques de Vinfluence de la voyelle sur la dynamique vocale, en Ml 
et en M2 séparément. Chanteurs hommes. 
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Ml 

M2 


dl 

F 

P 

dl 

F 

P 

do2 

11 

0,14 

0,870 

ns 

0 




ré2 

16 

2,01 

0,171 

ns 

4 




mi2 

21 

5,32 

0,015 

* 

11 

1,16 

0,356 

ns 

fa#2 

23 

7,78 

0,003 

** 

16 

0,04 

0,959 

ns 

sol#2 

23 

4,56 

0,023 

* 

17 

1,47 

0,262 

ns 

sib2 

23 

8,04 

0,003 

** 

19 

2,08 

0,155 

ns 

do3 

23 

11,00 

0,001 

*** 

22 

3,84 

0,039 

* 

ré3 

23 

10,00 

0,001 

*** 

23 

2,14 

0,143 

ns 

mi3 

23 

0,60 

0,558 

ns 

23 

1,36 

0,279 

ns 

fa# 3 

23 

1,78 

0,193 

ns 

23 

1,64 

0,217 

ns 

sol#3 

15 

1,25 

0,319 

ns 

23 

1,17 

0,329 

ns 

sib3 

9 

0,08 

0,925 

ns 

23 

0,26 

0,777 

ns 

do4 

5 




23 

0,26 

0,772 

ns 


Tab. A. 6 - Résultats statistiques de l’influence de la voyelle sur la dynamique vocale, en Ml 
et en M2 séparément. Chanteurs femmes. 


A.3 Test de l’influence de la voyelle sur l’aire des phonéto- 
grammes 



Ml 

M2 

dl 

F 

P 

dl 

F 

P 

Hommes 

38 

4,61 

0,016 * 

38 

2,49 

0,096 ns 

Femmes 

23 

4,44 

0,025 * 

23 

0,86 

0,438 ns 


Tab. A. 7 - Résultats statistiques de Vinfluence de la voyelle sur V aire des phonétogrammes, 
en Ml et en M2 séparément, pour les femmes et pour les hommes. 
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A.4 Tests de l’influence de la voyelle et des mécanismes laryngés 
sur les pentes phonétographiques et de la limite supérieure. 



Ml 

M2 


dl 

F 

P 

dl 

F 

P 

Femmes 

23 

0,11 

0,895 ns 

23 

0,16 

0,849 ns 

Hommes 

38 

0,97 

0,389 ns 

38 

0,51 

0,607 ns 


Tab. A.8 - Résultats statistiques de Vinfluence de la voyelle sur la pente des phonéto- 
grammes, en Ml et en M2 séparément, pour les femmes et pour les hommes. 



dl 

F 

P 

Hommes 

Femmes 

77 

47 

5,69 

0,60 

0,020 * 
0,443 ns 


Tab. A.9 - Résultats statistiques de Vinfluence du mécanisme laryngé sur la pente des pho- 
nétogrammes, pour les femmes et pour les hommes. 



Ml 

M2 


dl 

F 

P 

dl 

F 

P 

Hommes 

38 

2,48 

0,098 ns 

38 

0,58 

0,567 ns 

Femmes 

23 

0,38 

0,690 ns 

23 

1,33 

0,285 ns 


Tab. A. 10 - Résultats statistiques de Vinfluence de la voyelle sur la pente de la limite supé¬ 
rieure, en Ml et en M2 séparément, pour les femmes et pour les hommes. 



dl 

F 

P 

Hommes 

Femmes 

77 

47 

163 

21,3 

0,000 *** 
0,000 *** 


Tab. A. 11 - Résultats statistiques de Vinfluence du mécanisme laryngé sur la pente de la limite 
supérieure, pour les femmes et pour les hommes. 
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ANNEXE A. DÉTAILS DES ANALYSES STATISTIQUES 


A.5 Tests de la différence des limites supérieures des phonéto- 
grammes obtenues sur /a/ et /i/, entre les résultats mesu¬ 
rés en M2 et ceux simulés 



Hommes 

Femmes 

dl 

F 

P 

dl 

F 

P 

fa# 2 

17 

5,73 

0,029 

* 





sol#2 

19 

0,55 

0,467 

ns 

9 

1,13 

0,318 

ns 

sib2 

23 

0,32 

0,575 

ns 

11 

3,19 

0,104 

ns 

do3 

23 

2,56 

0,124 

ns 

13 

4,47 

0,056 

* 

ré3 

25 

2,30 

0,143 

ns 

12 

7,07 

0,022 

* 

mi3 

22 

0,14 

0,711 

ns 

14 

0,64 

0,437 

ns 

fa# 3 

19 

0,10 

0,755 

ns 

14 

0,58 

0,459 

ns 

sol#3 

16 

2,59 

0,128 

ns 

12 

0,64 

0,440 

ns 


Tab. A. 12 - Résultats de Vanalyse statistique de la différence des limites supérieures des pho- 
nétogrammes obtenues sur /a/ et /i/, entre les résultats mesurés en M2 et ceux simulés. Les 
résultats sont présentés séparément pour les hommes et pour les femmes. 
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Annexe B 

Limites des phonétogrammes 


Dans l’ensemble de cette annexe, nous présentons les phonétogrammes par mécanismes et 
par voyelles, séparément pour chaque chanteur. Chaque figure correspond à une voyelle donnée, 
les phonétogrammes de Ml sont tracés en traits pleins (bleus) et ceux de M2 en traits pointillés 
(rouges). Pour chaque mécanisme, la limite d’accolement glottique détectée figure en traits fins. 
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Annexe C 

Phonétogrammes de ER(FB2) 


Dans l’ensemble de cette annexe, nous présentons les phonétogrammes de ER(FB2), par 
mécanisme laryngé, par voyelle, et pour chaque chanteur. Le ER(FB2) est exprimé en dB, et est 
défini dans le chapitre 7. 

























































































































Phonétogrammes de ER(FB2), chanteur : S2 Phonétogrammes de ER(FB2), chanteur : S3 
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Phonétogrammes de ER(FB2), chanteur : S4 Phonétogrammes de ER(FB2), chanteur : MSI 


173 


o 



o 

<M 

i 


O 

CO 

I 


o 

'=d- 











o 


O 


O 


do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 


















































































































































































































































Phonétogrammes de ER(FB2), chanteur : MS2 Phonétogrammes de ER(FB2), chanteur : MS3 
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Phonétogrammes de ER(FB2), chanteur : MS4 Phonétogrammes de ER(FB2), chanteur : CTI 
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Phonétogrammes de ER(FB2), chanteur : CT2 Phonétogrammes de ER(FB2), chanteur : Tl 
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Phonétogrammes de ER(FB2), chanteur : T2 Phonétogrammes de ER(FB2), chanteur : T3 
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Phonétogrammes de ER(FB2), chanteur : T4 Phonétogrammes de ER(FB2), chanteur : Barl 
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Phonétogrammes de ER(FB2), chanteur : Bar2 Phonétogrammes de ER(FB2), chanteur : Bar3 
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Phonétogrammes de ER(FB2), chanteur : Bar4 Phonétogrammes de ER(FB2), chanteur : B1 
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Phonétogrammes de ER(FB2), chanteur : B2 Phonétogrammes de ER(FB2), chanteur : B3 
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ANNEXE C. PHONÉTOGRAMMES DE ER(FB2) 
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Annexe D 

Phonétogrammes de Oq 


Dans l’ensemble de cette annexe, nous présentons les phonétogrammes de quotient ouvert 
(Oq), par mécanisme laryngé, par voyelle, et pour chaque chanteur. 
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Phonétogrammes de Oq, chanteur : S2 Phonétogrammes de Oq, chanteur : S3 
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ANNEXE D. PHONÉTOGRAMMES DE OQ 

























































































































































































































































Phonétogrammes de Oq, chanteur : S4 Phonétogrammes de Oq, chanteur : MSI 


185 



do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 ' do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 






















































































































































































































































Phonétogrammes de Oq, chanteur : MS2 Phonétogrammes de Oq, chanteur : MS3 


186 


ANNEXE D. PHONÉTOGRAMMES DE OQ 












































































































































































































































Phonétogrammes de Oq, chanteur : MS4 Phonétogrammes de Oq, chanteur : CTI 
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Phonétogrammes de Oq, chanteur : CT2 Phonétogrammes de Oq, chanteur : Tl 
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ANNEXE D. PHONÉTOGRAMMES DE OQ 






































































































































































































































Phonétogrammes de Oq, chanteur : T2 Phonétogrammes de Oq, chanteur : T3 
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Phonétogrammes de Oq, chanteur : T4 Phonétogrammes de Oq, chanteur : Barl 
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ANNEXE D. PHONÉTOGRAMMES DE OQ 
















































































































































































































































Phonétogrammes de Oq, chanteur : Bar2 Phonétogrammes de Oq, chanteur : Bar3 
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Phonétogrammes de Oq, chanteur : Bar4 Phonétogrammes de Oq, chanteur : B1 
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ANNEXE D. PHONÉTOGRAMMES DE OQ 







































































































































































































































Phonétogrammes de Oq, chanteur : B2 Phonétogrammes de Oq, chanteur : B3 
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Annexe E 


Phonétogrammes de l’amplitude de 

l’EGG 


Dans l’ensemble de cette annexe, nous présentons les phonétogrammes d’amplitude du signal 
EGG, par mécanisme laryngé, par voyelle, et pour chaque chanteur. L’amplitude de l’EGG est 
normalisée, de 0 à 100 % (100 % correspondant à l’amplitude maximale observée, pour chaque 
chanteur, au cours de la session). 
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Phonétogrammes de EGG-ampI, chanteur : S2 Phonétogrammes de EGG-ampI, chanteur : S3 
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ANNEXE E. PHONETOGRAMMES DE L AMPLITUDE DE LEGG 
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Phonétogrammes de EGG-ampI, chanteur : S4 Phonétogrammes de EGG-ampI, chanteur : MSI 
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Phonétogrammes de EGG-ampI, chanteur : MS2 Phonétogrammes de EGG-ampI, chanteur : MS3 
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Phonétogrammes de EGG-ampI, chanteur : MS4 Phonétogrammes de EGG-ampI, chanteur : CTI 
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Phonétogrammes de EGG-ampI, chanteur : CT2 Phonétogrammes de EGG-ampI, chanteur : T1 
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Phonétogrammes de EGG-ampI, chanteur : T2 Phonétogrammes de EGG-ampI, chanteur : T3 


201 


o 

O O O O 

T- oo CD 


o 

<M 


O 








o o 
v- o 


o o o o o 

oo h- <o uo 



o o 
v- o 


o o o o o 
oo h- to uo ^r 



oooooooo 

^oa>ooh-<oüo^r 


jiï 


o 


O 


O 


do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 

























































































































































































































































































































































































































































































Phonétogrammes de EGG-ampI, chanteur : Bar2 Phonétogrammes de EGG-ampI, chanteur : Bar3 
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Phonétogrammes de EGG-ampI, chanteur : Bar4 Phonétogrammes de EGG-ampI, chanteur : B1 
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ANNEXE E. PHONETOGRAMMES DE L AMPLITUDE DE LEGG 



do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 














































































































































































































































Phonétogrammes de EGG-ampI, chanteur : B2 Phonétogrammes de EGG-ampI, chanteur : B3 
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Annexe F 

Phonétogrammes de VLP 


Dans l’ensemble de cette annexe, nous présentons les phonétogrammes de position verticale 
du larynx (VLP), par mécanisme laryngé, par voyelle, et pour chaque chanteur. Le VLP est 
normalisé, 0 % correspondant à la position de repos et db 100 % au maximum (ou minimum 
selon le signe) de déviation de la position verticale du larynx par rapport à létat de repos. 
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Phonétogrammes de VLP, chanteur : S4 Phonétogrammes de VLP, chanteur : MSI 
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Phonétogrammes de VLP, chanteur : MS4 Phonétogrammes de VLP, chanteur : CT 1 


211 


o 

O O 

T- LO 


O 


O 

LO 

I 




O 

O O 

T- LO 



O 


O 

LO 

I 




^r 

o 

"O 


oo 


oo 

O 

"O 


CO 


ON 

O 

■O 



^r 

o 

"O 


oo 


oo 

O 

"O 


ON 

O 

"O 


O O 
v- O 


O O O O O 

oo h- to uo ^r 



O O 
v- O 


O O O O O 

oo h- to uo ^r 


jiï 



O O O O O O O 

v- o o> oo h- CO no 



O 


o 


P 


do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 

































































































































































































































Phonétogrammes de VLP, chanteur : CT2 Phonétogrammes de VLP, chanteur : T1 
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ANNEXE F. PHONETOGRAMMES DE VLP 
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Phonétogrammes de VLP, chanteur : T2 Phonétogrammes de VLP, chanteur : T3 
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Phonétogrammes de VLP, chanteur : T4 Phonétogrammes de VLP, chanteur : Barl 
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Phonétogrammes de VLP, chanteur : Bar2 Phonétogrammes de VLP, chanteur : Bar3 


215 


o 

O O 

T- LO 


O 


O 

LO 

I 






^r 

o 

"O 


co 


CO 

O 

"O 


OJ 

O 

"O 


O O 
v- O 


O O O O O 

oo h- to uo ^r 



o 

"O 


co 


CO 

o 

"O 


CO 


o 

■O 



o 

■o 


co 


CO 

o 

"O 


OJ 

o 

"O 


o o 
v- o 


o o o o o 
oo h- to uo ^r 


co 




o 

a> 


o 

a> 


O 


do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 do2 fa#2 do3 fa#3 do4 













































































































































































































































































































































































































































































































Phonétogrammes de VLP, chanteur : B2 Phonétogrammes de VLP, chanteur : B3 
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Résumé 


Cette thèse porte sur l’influence de la voyelle sur les mécanismes laryngés (Ml et M2) en voix 
chantée. Nous avons observé que les chanteurs associent le /a/ à Ml et le /i/ à M2. Nous avons 
alors cherché des corrélats physiologiques et acoustiques en étudiant l’influence des voyelles sur 
les limites phonétographiques, sur plusieurs paramètres de source et spectraux ainsi que sur les 
transitions des mécanismes. 

La limite supérieure des phonétogrammes est de 10 dB plus intense pour /a/ que pour /i/ en 
Ml, mais pas en M2. Le phonétogramme de M2 est donc décalé, par rapport à celui de Ml, vers 
les faibles niveaux pour /a/ mais pas pour /i/. Ce décalage est dû en partie à la différence de 
valeurs de quotient ouvert entre Ml et M2. De plus, l’amplitude du signal électroglottographique 
augmente avec l’intensité et est plus grande pour /i/ que pour /a/, révélant des différences 
glottiques de production de voyelles à mêmes hauteur et intensité. Les liens entre les voyelles et 
la position verticale du larynx dépendent de l’expertise vocale des chanteurs. 

L’étude de la répartition de l’énergie spectrale est effectuée en calculant le rapport de l’énergie 
(ER) de la bande du formant du chanteur (FB2) ou des hautes fréquences (FB3) à l’énergie 
totale. Il est possible d’obtenir un formant du chanteur aussi intense en M2 qu’en Ml. ER(FB2) 
peut saturer à haut niveau, en fonction de la voyelle, du mécanisme et de l’expertise vocale. 
ER(FB3) est plus faible en M2 qu’en Ml. 

L’intervalle fréquentiel des sauts M1^M2 augmente avec l’intensité mais pas avec la hauteur. 
Ceci n’est pas observé dans le sens M2—>M1. La fréquence de déclenchement de la transition est 
plus basse pour /i/ que pour /a/. 

Mots clés : voix chantée, mécanisme laryngé, registre, voyelle, phonétogramme, source glot- 
tique, formant du chanteur, saut de fréquence. 


Abstract 

This dissertation concerns the influence of the vowel on the laryngeal mechanisms (Ml and 
M2) in singing voice. We observed that singers associate /a/ with Ml and /i/ with M2. We 
then searched for physiological and acoustical correlates by studying the influence of vowels 
on the Voice Range Profile (VRP) on different glottal and spectral parameters as well as the 
mechanisms’ transitions. 

The upper VRP limit is 10 dB louder for /a/ than for /i/ in Ml, but not in M2. The M2 
VRP is therefore at a lower level when compared to the Ml VRP for /a/, but not for /i/. 
This shift is partly explained by different open quotient values for Ml and M2. In addition, the 
amplitude of the electroglottographic signal increases with intensity and is larger for /i/ than 
for /a/, revealing glottal différences in the production of vowels at the same pitch and intensity. 
The influence of the vowel on the vertical larynx position dépends on the vocal expertise of the 
singers. 

The spectral study is done by calculating the ratio (ER) between either the energy of the 
frequency band where the singer’s formant is located (FB2) or of the band corresponding to 
high frequencies (FB3) and the total energy. The energy of the singer’s formant can be as high 
in M2 as in Ml. ER(FB2) can reach a saturation level depending on the vowel, the laryngeal 
mechanism, the vocal expertise. ER(FB3) is lower in M2 than in Ml. 

The frequency jump that occurs in M1^M2 transitions increases with level, but not with 
pitch. These corrélations were not observed for M2^M1 transitions. The starting frequency of 
the jumps is lower for /i/ than for /a/. 

Key words: singing voice, laryngeal mechanism, register, vowel, Voice Range Profile, glottal 
source, singer’s formant, frequency jump. 


